OpenAI GPT-4.1模型承诺改进编码和指令

来源:InfoWorld 作者:Lynn Greiner

OpenAI GPT-4.1模型承诺改进编码和指令

OpenAI表示,仅通过API获得的GPT-4.1、GPT-4.1 mini和GPT-4.1 nano将以更低的价格提供比GPT-4o和GPT-4o mini更好的性能。

OpenAI宣布了推出新版本GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,它表示其性能“全面”优于GPT-4o和GPT-4o mini。

随着GPT-4.1系列的推出,OpenAI还宣布将弃用API中的GPT-4.5。该公司表示,GPT-4.5预览版将于2025年7月14日完全关闭,因为GPT-4.1以更低的成本和延迟为许多功能提供了类似或更好的性能。

OpenAI表示,新版本的上下文窗口比前代版本大得多——100万个tokens,而GPT-4o的128,000个tokens——并提供了更好的长上下文理解。输出令牌限制也从GPT-4o的16,385增加到GPT-4.1的32,767。

然而,GPT-4.1只能通过API提供,而不是在ChatGPT中提供。OpenAI解释说,许多改进已被纳入GPT-4o的最新版本中,未来版本将添加更多改进。

OpenAI表示,它与开发人员社区密切合作,优化模型以满足他们的优先事项。例如,它验证了SWE-bench的编码分数比GPT-4o提高了21.4%。

更擅長编码和复杂的任务

该公司特别表达了GPT-4.1 mini和GPT-4.1 nano 版本的性能。

“GPT-4.1 mini是类似小型车性能的重大飞跃,甚至在许多基准测试中都超过了GPT-4o。公告说:“它在情报评估中与GPT-4o相匹配或超过GPT-4o,同时将延迟减少了近一半,并将成本降低了83%。”“对于需要低延迟的任务,GPT-4.1 nano是我们最快、最便宜的模型。它凭借其100万个令牌上下文窗口,在小规模上提供了卓越的性能,在MMLU上得分为80.1%,在GPQA上得分为50.3%,在Aider多语编码上得分为9.8%,甚至高于GPT-4o mini。它非常适合分类或自动完成等任务。”

OpenAI表示,这些改进与响应API等原语相结合,将允许开发人员构建更有用和更可靠的agents,这些agents将执行复杂的任务,例如从大型文档中提取见解和“用最少的牵手”解决客户请求。

OpenAI还表示,GPT-4.1在agents解决编码任务、前端编码、减少无同编辑、可靠地遵循diff格式、确保一致使用工具等任务方面明显比GPT-4o好。

该公司表示,它也更便宜。其中位数查询成本比GPT-4o低26%,即时缓存折扣从50%增加到75%。此外,长上下文请求按每个代币的标准价格计费。这些模型也可以在OpenAI的批处理API中使用,额外享受50%的折扣。

分析师提出问题

然而,信息技术研究集团的技术顾问Justin St-Maurice对一些说法有所关注。

他说:“这一公告肯定会带来一些问题,特别是在效率、定价和规模方面。”“如果83%的成本降低是真的,这可能是一件大事,特别是当大型企业和云提供商密切关注每瓦的价值时。也就是说,它没有提到它与什么基线或模型进行了比较。”

但St-Maurice仍然认为,尽管降价,但这些版本是高级产品。

他说:“OpenAI专注于长上下文性能和更高效的变体,如mini或nano,这与当前围绕MCP[模型上下文协议]服务器和代理系统的对话保持一致。”“能够处理多达100万个tokens为更复杂的工作流程和实时推理打开了大门,但每百万个输入tokens的2个和每百万个输出的8个tokens使其更具有溢价的产品,特别是与Llama等其他选项相比,Llama等其他选项越来越多地用于大规模地用于成本敏感的推理。”

在这种情况下,St-Maurice说:“如果OpenAI能够证明这些成本和性能的提升,那么它将加强其在高效、可扩展的智能方面的地位。然而,为了获得更强大的企业采用率,他们需要在实际基准和定价基线方面更加透明。”

本文转载自InfoWorld,本文观点不代表雅典娜AI助手YadiannaAI立场。

(0)
Athena的头像Athena
上一篇 2025年4月16日 下午2:45
下一篇 2025年4月16日 下午3:36

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

客服邮箱: kefu@yadiannaai.com

投稿邮箱:tougao@yadiannaai.com

合作邮箱:hezuo@yadiannaai.com

关注微信