DeepSeek 公布 V3 降本技术,梁文锋参与
据爱范儿消息,日前,DeepSeek 公布了旗下 V3 模型在训练、推理过程中,如何解决「硬件瓶颈」和「降本」的技术报告,值得一提的是,DeepSeek 创始人梁文锋也在作者名单中。
据报告显示,DeepSeek-V3 使用 2048 个英伟达 H800 GPU 进行训练,但其达到了超大规模集群相当的训练效果,其中包含了以下四项技术:
1、采用多头潜在注意力(MLA),减少临时数据(KV Cache)的内存占用。通过内存优化,DeepSeek-V3 的 KV 缓存大小每 token 仅需 70 KB,是传统方法的 1/7 至 1/4,从而大幅降低显存压力。
2、采用 DeepSeek-MoE(混合专家架构)进行计算优化。DeepSeek-V3 凭借 MoE 单次推理只激活部分参数的思路,训练成本仅为同规模稠密模型的 1/10。并且得益于激活参数减少,V3 能够在消费级 GPU 上运行,并达到每秒生成近 20 个 toeken。
3、通过 FP8 低精度训练,将模型所需内存占用和计算量减半,并通过「精细量化」保持精度要求。DeepSeek-V3 通过 FP8,训练成本成功降低 50%,精度损失小于 0.25%。
4、通信方面,DeepSeek-V3 采用了多层胖树网络(Multi-Plane Fat-Tree),避免不同任务流量冲突;在模型推理时,还将「注意力计算」和「专家间通信」分阶段执行,利用流水线并行(DualPipe)让 GPU 在计算时同时传输数据。
5、推理加速方面,DeepSeek-V3 使用多 token 预测(MTP)的方法,将模型生成速度提升了 1.8 倍,同时保持准确率在 80%-90%。另外,DeepSeek 团队还对未来 AI 发展的多维度进行了展望,有「CPU 与 GPU 通信瓶颈」「低精度计算支持」「系统鲁棒性挑战」「内存系统优化」等方面内容。
技术报告原文可以访问:https://arxiv.org/pdf/2505.09343
MiniMax 发布全新文转语音模型,超越 OpenAI
据爱范儿消息,5 月 15 日,MiniMax 稀宇科技宣布,其基于 AR Transformer 模型研发的高质量 TTS 系统「MiniMax Speech 02」正式公布。
据悉,MiniMax Speech 02 具有足够强的泛化能力,能够轻松驾驭 32 语种、不同口音、不同情绪的人声。
在性能表现上,MiniMax Speech 02 在两项全球权威语音基准测评榜单(Artificial Analysis Speech Arena 和 Hugging Face TTS Arena)中,超越 OpenAI、ElevenLabs 等全球性能优异的模型,双双位列第一。
另外,根据 Arena 榜单的 ELO 评分结果显示,从用户体验上, MiniMax Speech 02 的听感更加优异。同时该模型系统还做到了价格更低,分别是 ElevenLabs Flash V2.5 与 Mutilingual V2 的一半与四分之一。
目前,MiniMax Speech 02 已上架 MiniMax Audio,并且公布了技术细节、实验对比数据、开源的多语言测试集,以及技术报告。
OpenAI CEO 预告新产品
据爱范儿消息,今日凌晨,OpenAI CEO Sam Altman 发文预告称,不久后 OpenAI 团队将发布一个低调的研究预览,并表示将会给该研究预览起一个「比 ChatGPT 更好」的名字,以防止过于火爆。
近期,Altman 参加投资机构红杉资本的「2025 AI Ascent」大会,其在问答环节时指出,尽管 OpenAI 没有明确的「总体规划」,但团队希望开发出一种类似于订阅式操作系统的 AI 产品,并构建一个能够整合「用户一生中所触及到」的模型。
另外,在被问及 OpenAI 对于「如何使用其正在寻求的巨额投资」是否有明确计划时,Altman 回答称,团队将努力打造出色的模型,推出优质的产品,除此之外并无其他总体规划。
Anthropic 将在未来几周推出两款新的 Claude 系列推理模型
据 The Information 消息,Anthropic 将在未来几周推出两款新的 Claude 系列推理模型。
据知情人士透露,两款新模型分别为 Claude Sonnet 系列和 Claude Opus 系列。
据悉,两款新模型能够从「思考」与「探索」两种模式之间自由切换,从而来满足解决问题的最佳方式;另外,新模型还将支持「工具使用」,即调用外部工具、App 和数据库来寻求答案。值得一提的是,其中有一款模型若在使用工具解决问题时「卡壳」,它可以回到「推理」模型来思考相关问题并进行自我修正。
报道指出,这对新模型生成代码来说很实用,因为模型能够自我检查一遍以减少程序出错。上月,Claude 宣布上线 Research 功能和 Google Workspace 深度集成。而上述两个功能都多少离不开 Agent 和 MCP 协议的关联。其中,Claude 的 Research 拥有代理式(Agentic)搜索框架,支持自主规划并执行多步骤搜索任务;而 Claude 集成的 Google Workspace 依靠 Anthropic 的 MCP 协议。
宇树科技申请多枚机器人牌照商标
据36氪消息,近日,杭州宇树科技有限公司申请注册“机器人牌照”“机牌”“Robot license”“Robot plate”等商标,国际分类涉及科学仪器、运输工具、广告销售等,当前商标状态均为等待实质审查。
杭州宇树科技有限公司成立于2016年8月,法定代表人为王兴兴,注册资本约259.42万元人民币,由王兴兴、汉海信息技术(上海)有限公司、宁波红杉科盛股权投资合伙企业(有限合伙)等共同持股。
OpenAI宣布向ChatGPT用户开放GPT-4.1模型
据界面新闻消息,北京时间5月15日凌晨,美国OpenAI宣布,应广大用户的要求,GPT-4.1即日起将直接在ChatGPT中提供。
GPT-4.1是一款专攻编码任务和指令遵循的专用模型。Plus、Pro和Team用户将能够通过模型选择器中的“更多模型”下拉菜单访问GPT-4.1。
企业版和教育版用户将在未来几周内获得访问权限。
OpenAI还将推出GPT-4.1 mini替代现有的GPT-4o mini,该版本将在ChatGPT中向所有用户开放。
谷歌Deepmind发布用于设计高级算法的编程AI Agent
据财联社消息,谷歌Deepmind在官网发布了用于设计高级算法的编程AI Agent——AlphaEvolve。
值得一提的是,谷歌在展示AlphaEvolve的能力时,就特意找了一道300多年的数学难题——亲吻数问题。
这道题的历史最早可以追溯到1694年,牛顿还和别人辩论、研究过。其难点在于给定维度的空间中,最多可以有多少个相同大小的球体同时接触一个中心球体,这些球体之间不发生重叠。而AlphaEvolve发现了由593个外层球体组成的结构型,并在11维空间中建立了新的下界,超越之前数学家们创造的记录。
Manus 辟谣「母公司拟以 15 亿美元估值融资」
据爱范儿消息,昨日,有消息称 Manus AI 母公司「蝴蝶效应」拟以 15 亿美元估值进行融资,规模 1 亿美元。
该消息出现后,Manus AI 官方发文回应否认了该消息:此消息严重失实,目前公司正专注产品研发和用户体验。对于此虚假消息可能造成的侵害,本公司保留法律追究的权利。
但据彭博社上个月援引知情人士消息, Manus AI 近期完成一轮融资,由硅谷风投公司 Benchmark 领投,融资金额达 7500 万美元(约合 5.46 亿人民币)。此次融资让 Manus AI 的估值提升至近 5 亿美元(约合 36.44 亿人民币),这一估值比之前的估值增长了约五倍。
除了 Benchmark,还有多家现有投资方参与了此轮融资。Manus 背后的初创公司「蝴蝶效应」表示,这笔资金将用于将其服务拓展至美国、日本和中东等海外市场。
Poe:DeepSeek 使用率下降 50%
据爱范儿消息,日前,大模型整合应用平台 Poe 发布了《2025 年春季 AI 模型使用趋势报告》,具体来看:
DeepSeek 的「病毒式」传播有所减弱,其使用率从 2 月的峰值 7% 降至 4 月底的 3%,整体使用率下降超过 50%;
OpenAI 凭借其在 GPT-4o 中推出新的文生图生成器后,通过「吉卜力风格」「仿真自拍」等热点玩法,实现了「病毒式」使用率增长;
快手的视频生成模型「可灵」在发布 Kling-2.0-Master 后,用短短三周时间获得了 21% 的 Poe 视频生成占有率。
Poe 还在报告中提到,发送给 Poe 内的推理模型的消息文本份额,从约 2% 增加至约 10%,其中 DeepSeek「病毒式」传播期间达到了峰值。
另外,Poe 订阅者对 Gemini 2.5 Pro 的使用正在迅速增长,该模型在发布仅约 6 周内就获得了约 30% 的推理消息份额。
具体报告:https://poe.com/zh/blog/spring-2025-ai-model-usage-trends
OpenAI 开放 GPT-4.1 使用
据爱范儿消息,今日凌晨,OpenAI 宣布开放旗下 GPT-4.1 模型,现已支持在 ChatGPT 中使用。
GPT-4.1 系列包含三个版本:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,三者均支持高达 100 万 token 的上下文窗口,相比 GPT-4o 的 12.8 万 token 实现大幅提升。
在多方面表现上,GPT-4.1 相较于 GPT-4o 都有了不小提升,GPT‑4.1 mini 在多项测试中甚至超越 GPT-4o,在保持与 GPT‑4o 相似或更高智能表现的同时,延迟几乎减半,成本降低了 83%。
目前,Plus、Pro 和 Team 用户已开放使用 GPT-4.1,企业和教育用户将在未来几周内获得访问权限。
另外,OpenAI 还在 ChatGPT 中为所有用户推出 GPT-4.1-mini,以取代 GPT-4o-mini。