2025年5月16日 • 周五
09:53

DeepSeek 公布 V3 降本技术,梁文锋参与

据爱范儿消息,日前,DeepSeek 公布了旗下 V3 模型在训练、推理过程中,如何解决「硬件瓶颈」和「降本」的技术报告,值得一提的是,DeepSeek 创始人梁文锋也在作者名单中。
据报告显示,DeepSeek-V3 使用 2048 个英伟达 H800 GPU 进行训练,但其达到了超大规模集群相当的训练效果,其中包含了以下四项技术:
1、采用多头潜在注意力(MLA),减少临时数据(KV Cache)的内存占用。通过内存优化,DeepSeek-V3 的 KV 缓存大小每 token 仅需 70 KB,是传统方法的 1/7 至 1/4,从而大幅降低显存压力。
2、采用 DeepSeek-MoE(混合专家架构)进行计算优化。DeepSeek-V3 凭借 MoE 单次推理只激活部分参数的思路,训练成本仅为同规模稠密模型的 1/10。并且得益于激活参数减少,V3 能够在消费级 GPU 上运行,并达到每秒生成近 20 个 toeken。
3、通过 FP8 低精度训练,将模型所需内存占用和计算量减半,并通过「精细量化」保持精度要求。DeepSeek-V3 通过 FP8,训练成本成功降低 50%,精度损失小于 0.25%。
4、通信方面,DeepSeek-V3 采用了多层胖树网络(Multi-Plane Fat-Tree),避免不同任务流量冲突;在模型推理时,还将「注意力计算」和「专家间通信」分阶段执行,利用流水线并行(DualPipe)让 GPU 在计算时同时传输数据。
5、推理加速方面,DeepSeek-V3 使用多 token 预测(MTP)的方法,将模型生成速度提升了 1.8 倍,同时保持准确率在 80%-90%。另外,DeepSeek 团队还对未来 AI 发展的多维度进行了展望,有「CPU 与 GPU 通信瓶颈」「低精度计算支持」「系统鲁棒性挑战」「内存系统优化」等方面内容。

技术报告原文可以访问:https://arxiv.org/pdf/2505.09343

09:44

MiniMax 发布全新文转语音模型,超越 OpenAI

据爱范儿消息,5 月 15 日,MiniMax 稀宇科技宣布,其基于 AR Transformer 模型研发的高质量 TTS 系统「MiniMax Speech 02」正式公布。
据悉,MiniMax Speech 02 具有足够强的泛化能力,能够轻松驾驭 32 语种、不同口音、不同情绪的人声。
在性能表现上,MiniMax Speech 02 在两项全球权威语音基准测评榜单(Artificial Analysis Speech Arena 和 Hugging Face TTS Arena)中,超越 OpenAI、ElevenLabs 等全球性能优异的模型,双双位列第一。
另外,根据 Arena 榜单的 ELO 评分结果显示,从用户体验上, MiniMax Speech 02 的听感更加优异。同时该模型系统还做到了价格更低,分别是 ElevenLabs Flash V2.5 与 Mutilingual V2 的一半与四分之一。
目前,MiniMax Speech 02 已上架 MiniMax Audio,并且公布了技术细节、实验对比数据、开源的多语言测试集,以及技术报告。

09:42

OpenAI CEO 预告新产品

据爱范儿消息,今日凌晨,OpenAI CEO Sam Altman 发文预告称,不久后 OpenAI 团队将发布一个低调的研究预览,并表示将会给该研究预览起一个「比 ChatGPT 更好」的名字,以防止过于火爆。
近期,Altman 参加投资机构红杉资本的「2025 AI Ascent」大会,其在问答环节时指出,尽管 OpenAI 没有明确的「总体规划」,但团队希望开发出一种类似于订阅式操作系统的 AI 产品,并构建一个能够整合「用户一生中所触及到」的模型。 
另外,在被问及 OpenAI 对于「如何使用其正在寻求的巨额投资」是否有明确计划时,Altman 回答称,团队将努力打造出色的模型,推出优质的产品,除此之外并无其他总体规划。

09:41

Anthropic 将在未来几周推出两款新的 Claude 系列推理模型

据 The Information 消息,Anthropic 将在未来几周推出两款新的 Claude 系列推理模型。
据知情人士透露,两款新模型分别为 Claude Sonnet 系列和 Claude Opus 系列。
据悉,两款新模型能够从「思考」与「探索」两种模式之间自由切换,从而来满足解决问题的最佳方式;另外,新模型还将支持「工具使用」,即调用外部工具、App 和数据库来寻求答案。值得一提的是,其中有一款模型若在使用工具解决问题时「卡壳」,它可以回到「推理」模型来思考相关问题并进行自我修正。
报道指出,这对新模型生成代码来说很实用,因为模型能够自我检查一遍以减少程序出错。上月,Claude 宣布上线 Research 功能和 Google Workspace 深度集成。而上述两个功能都多少离不开 Agent 和 MCP 协议的关联。其中,Claude 的 Research 拥有代理式(Agentic)搜索框架,支持自主规划并执行多步骤搜索任务;而 Claude 集成的 Google Workspace 依靠 Anthropic 的 MCP 协议。

09:39

宇树科技申请多枚机器人牌照商标

据36氪消息,近日,杭州宇树科技有限公司申请注册“机器人牌照”“机牌”“Robot license”“Robot plate”等商标,国际分类涉及科学仪器、运输工具、广告销售等,当前商标状态均为等待实质审查。
杭州宇树科技有限公司成立于2016年8月,法定代表人为王兴兴,注册资本约259.42万元人民币,由王兴兴、汉海信息技术(上海)有限公司、宁波红杉科盛股权投资合伙企业(有限合伙)等共同持股。

09:36

OpenAI宣布向ChatGPT用户开放GPT-4.1模型

据界面新闻消息,北京时间5月15日凌晨,美国OpenAI宣布,应广大用户的要求,GPT-4.1即日起将直接在ChatGPT中提供。
GPT-4.1是一款专攻编码任务和指令遵循的专用模型。Plus、Pro和Team用户将能够通过模型选择器中的“更多模型”下拉菜单访问GPT-4.1。
企业版和教育版用户将在未来几周内获得访问权限。
OpenAI还将推出GPT-4.1 mini替代现有的GPT-4o mini,该版本将在ChatGPT中向所有用户开放。

09:35

谷歌Deepmind发布用于设计高级算法的编程AI Agent

据财联社消息,谷歌Deepmind在官网发布了用于设计高级算法的编程AI Agent——AlphaEvolve。
值得一提的是,谷歌在展示AlphaEvolve的能力时,就特意找了一道300多年的数学难题——亲吻数问题。
这道题的历史最早可以追溯到1694年,牛顿还和别人辩论、研究过。其难点在于给定维度的空间中,最多可以有多少个相同大小的球体同时接触一个中心球体,这些球体之间不发生重叠。而AlphaEvolve发现了由593个外层球体组成的结构型,并在11维空间中建立了新的下界,超越之前数学家们创造的记录。

2025年5月15日 • 周四
09:05

Manus 辟谣「母公司拟以 15 亿美元估值融资」

据爱范儿消息,昨日,有消息称 Manus AI 母公司「蝴蝶效应」拟以 15 亿美元估值进行融资,规模 1 亿美元。
该消息出现后,Manus AI 官方发文回应否认了该消息:此消息严重失实,目前公司正专注产品研发和用户体验。对于此虚假消息可能造成的侵害,本公司保留法律追究的权利。
但据彭博社上个月援引知情人士消息, Manus AI 近期完成一轮融资,由硅谷风投公司 Benchmark 领投,融资金额达 7500 万美元(约合 5.46 亿人民币)。此次融资让 Manus AI 的估值提升至近 5 亿美元(约合 36.44 亿人民币),这一估值比之前的估值增长了约五倍。
除了 Benchmark,还有多家现有投资方参与了此轮融资。Manus 背后的初创公司「蝴蝶效应」表示,这笔资金将用于将其服务拓展至美国、日本和中东等海外市场。

09:03

Poe:DeepSeek 使用率下降 50%

据爱范儿消息,日前,大模型整合应用平台 Poe 发布了《2025 年春季 AI 模型使用趋势报告》,具体来看:
DeepSeek 的「病毒式」传播有所减弱,其使用率从 2 月的峰值 7% 降至 4 月底的 3%,整体使用率下降超过 50%;
OpenAI 凭借其在 GPT-4o 中推出新的文生图生成器后,通过「吉卜力风格」「仿真自拍」等热点玩法,实现了「病毒式」使用率增长;
快手的视频生成模型「可灵」在发布 Kling-2.0-Master 后,用短短三周时间获得了 21% 的 Poe 视频生成占有率。
Poe 还在报告中提到,发送给 Poe 内的推理模型的消息文本份额,从约 2% 增加至约 10%,其中 DeepSeek「病毒式」传播期间达到了峰值。
另外,Poe 订阅者对 Gemini 2.5 Pro 的使用正在迅速增长,该模型在发布仅约 6 周内就获得了约 30% 的推理消息份额。

具体报告:https://poe.com/zh/blog/spring-2025-ai-model-usage-trends

09:02

OpenAI 开放 GPT-4.1 使用

据爱范儿消息,今日凌晨,OpenAI 宣布开放旗下 GPT-4.1 模型,现已支持在 ChatGPT 中使用。
GPT-4.1 系列包含三个版本:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,三者均支持高达 100 万 token 的上下文窗口,相比 GPT-4o 的 12.8 万 token 实现大幅提升。
在多方面表现上,GPT-4.1 相较于 GPT-4o 都有了不小提升,GPT‑4.1 mini 在多项测试中甚至超越 GPT-4o,在保持与 GPT‑4o 相似或更高智能表现的同时,延迟几乎减半,成本降低了 83%。
目前,Plus、Pro 和 Team 用户已开放使用 GPT-4.1,企业和教育用户将在未来几周内获得访问权限。
另外,OpenAI 还在 ChatGPT 中为所有用户推出 GPT-4.1-mini,以取代 GPT-4o-mini。

点击加载更多

联系我们

客服邮箱: kefu@yadiannaai.com

投稿邮箱:tougao@yadiannaai.com

合作邮箱:hezuo@yadiannaai.com

关注微信