来源：InfoWorld 作者：Lynn Greiner

OpenAI表示，仅通过API获得的GPT-4.1、GPT-4.1 mini和GPT-4.1 nano将以更低的价格提供比GPT-4o和GPT-4o mini更好的性能。

OpenAI宣布了推出新版本GPT-4.1、GPT-4.1 mini和GPT-4.1 nano，它表示其性能“全面”优于GPT-4o和GPT-4o mini。

随着GPT-4.1系列的推出，OpenAI还宣布将弃用API中的GPT-4.5。该公司表示，GPT-4.5预览版将于2025年7月14日完全关闭，因为GPT-4.1以更低的成本和延迟为许多功能提供了类似或更好的性能。

OpenAI表示，新版本的上下文窗口比前代版本大得多——100万个tokens，而GPT-4o的128,000个tokens——并提供了更好的长上下文理解。输出令牌限制也从GPT-4o的16,385增加到GPT-4.1的32,767。

然而，GPT-4.1只能通过API提供，而不是在ChatGPT中提供。OpenAI解释说，许多改进已被纳入GPT-4o的最新版本中，未来版本将添加更多改进。

OpenAI表示，它与开发人员社区密切合作，优化模型以满足他们的优先事项。例如，它验证了SWE-bench的编码分数比GPT-4o提高了21.4%。

Table of Contents

更擅長编码和复杂的任务

该公司特别表达了GPT-4.1 mini和GPT-4.1 nano 版本的性能。

“GPT-4.1 mini是类似小型车性能的重大飞跃，甚至在许多基准测试中都超过了GPT-4o。公告说：“它在情报评估中与GPT-4o相匹配或超过GPT-4o，同时将延迟减少了近一半，并将成本降低了83%。”“对于需要低延迟的任务，GPT-4.1 nano是我们最快、最便宜的模型。它凭借其100万个令牌上下文窗口，在小规模上提供了卓越的性能，在MMLU上得分为80.1%，在GPQA上得分为50.3%，在Aider多语编码上得分为9.8%，甚至高于GPT-4o mini。它非常适合分类或自动完成等任务。”

OpenAI表示，这些改进与响应API等原语相结合，将允许开发人员构建更有用和更可靠的agents，这些agents将执行复杂的任务，例如从大型文档中提取见解和“用最少的牵手”解决客户请求。

OpenAI还表示，GPT-4.1在agents解决编码任务、前端编码、减少无同编辑、可靠地遵循diff格式、确保一致使用工具等任务方面明显比GPT-4o好。

该公司表示，它也更便宜。其中位数查询成本比GPT-4o低26%，即时缓存折扣从50%增加到75%。此外，长上下文请求按每个代币的标准价格计费。这些模型也可以在OpenAI的批处理API中使用，额外享受50%的折扣。

分析师提出问题

然而，信息技术研究集团的技术顾问Justin St-Maurice对一些说法有所关注。

他说：“这一公告肯定会带来一些问题，特别是在效率、定价和规模方面。”“如果83%的成本降低是真的，这可能是一件大事，特别是当大型企业和云提供商密切关注每瓦的价值时。也就是说，它没有提到它与什么基线或模型进行了比较。”

但St-Maurice仍然认为，尽管降价，但这些版本是高级产品。

他说：“OpenAI专注于长上下文性能和更高效的变体，如mini或nano，这与当前围绕MCP[模型上下文协议]服务器和代理系统的对话保持一致。”“能够处理多达100万个tokens为更复杂的工作流程和实时推理打开了大门，但每百万个输入tokens的2个和每百万个输出的8个tokens使其更具有溢价的产品，特别是与Llama等其他选项相比，Llama等其他选项越来越多地用于大规模地用于成本敏感的推理。”

在这种情况下，St-Maurice说：“如果OpenAI能够证明这些成本和性能的提升，那么它将加强其在高效、可扩展的智能方面的地位。然而，为了获得更强大的企业采用率，他们需要在实际基准和定价基线方面更加透明。”

本文转载自InfoWorld，本文观点不代表雅典娜AI助手YadiannaAI立场。

OpenAI GPT-4.1模型承诺改进编码和指令

更擅長编码和复杂的任务

分析师提出问题

发表回复

联系我们

OpenAI GPT-4.1模型承诺改进编码和指令

更擅長编码和复杂的任务

分析师提出问题

相关推荐

信贷审批流程由数天压缩至分钟级，人工智能驱动银行业数字化转型

DeepSeek 公布推理引擎开源路径

OpenAI 准备推出 GPT-4.1

Meta正为AI眼镜开发人脸识别功能

南京大学李武军教授课题组分布式训练算法，大模型训练加速3.8倍

维基百科正在向人工智能开发人员提供数据

发表回复

联系我们