AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens、代码生成速度飙升 40%

2025-04-15 14:31:00影宴数码

感谢本站网友 Nuc_F、Leung丶1435、浪花庆山粉的线索投递！

本站 4 月 15 日消息，OpenAI 公司今天（4 月 15 日）发布博文，宣布以 API 的形式发布 GPT-4.1 系列模型，涵盖 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

这些模型在编程、指令遵循和长文本理解方面全面超越前代 GPT-4o 及 GPT-4o mini，上下文窗口最高支持 100 万 tokens，知识更新至 2024 年 6 月。

需要注意的是，该系列模型现阶段专为开发者打造，目前仅通过开发者 API 方式提供，普通用户暂时无法通过 ChatGPT 页面体验该模型。

OpenAI 表示在编程方面，相比较 GPT-4o 模型，GPT-4.1 模型的代码生成速度飙升 40%，且用户输入查询的成本降低了 80%。

新模型性能

OpenAI 在官方博文中表示，GPT-4.1 系列模型在编程、指令遵循和长文本处理上表现优异，全面超越 GPT-4o 及 GPT-4o mini。

GPT-4.1 在编程测试 SWE-bench Verified 中得分 54.6%，较 GPT-4o 提升 21.4 个百分点，在指令遵循测试 MultiChallenge 中提升 10.5 个百分点，在多模态长文本测试 Video-MME 中创下 72.0% 的新纪录。

GPT-4.1 mini 和 nano 展现了小型模型的巨大潜力。GPT-4.1 mini 在多项基准测试中媲美甚至超越 GPT-4o，延迟降低近一半，成本减少 83%。

GPT-4.1 nano 作为最快、最经济的选择，拥有 100 万个 token 的上下文窗口，在 MMLU 测试中得分 80.1%，适合分类和自动补全任务。

这些模型通过优化推理栈和提示缓存技术，显著降低了首次响应时间，为开发者提供高效低成本的解决方案。

GPT-4.1 系列模型在实际应用中表现突出，特别适合构建智能代理，处理复杂任务。例如，Windsurf 测试显示，GPT-4.1 在编程效率上提升 30%，减少 50% 不必要编辑；Thomson Reuters 的法律 AI 助手 CoCounsel 使用 GPT-4.1 后，多文档审查准确率提升 17%。

命名混乱引发关注

GPT-4.1 的发布加剧了 OpenAI 产品命名的复杂性。

ChatGPT 目前已包含 GPT-4o、GPT-4o mini、o1-pro 等多种模型选项。OpenAI 首席执行官山姆・奥尔特曼（Sam Altman）早在 2024 年 2 月就承认命名问题。

他在 X 平台表示，产品线过于繁杂，计划通过未来的 GPT-5 整合品牌，OpenAI 计划在 2025 年 7 月前逐步淘汰 API 中的 GPT-4.5 Preview 模型，从而缓解命名混乱。

这一临时模型于 2024 年 2 月推出，曾被批评为“失败品”，开发者需在 2025 年 7 月前迁移到其他模型，不过，GPT-4.5 在 ChatGPT 中暂时保留，未受影响。

费用

API价格方面，OpenAIGPT-4.1模型每 100万tokens输入费用为 2 美元（本站注：现汇率约合 14.6 元人民币），每 100万tokens输出费用为 8 美元（现汇率约合 58.3 元人民币）。在中等查询中，相比较GPT-4o，GPT-4.1不仅能提供更强悍的性能，而且便宜 26%。