09:53

DeepSeek 公布 V3 降本技术，梁文锋参与

据爱范儿消息，日前，DeepSeek 公布了旗下 V3 模型在训练、推理过程中，如何解决「硬件瓶颈」和「降本」的技术报告，值得一提的是，DeepSeek 创始人梁文锋也在作者名单中。
据报告显示，DeepSeek-V3 使用 2048 个英伟达 H800 GPU 进行训练，但其达到了超大规模集群相当的训练效果，其中包含了以下四项技术：
1、采用多头潜在注意力（MLA），减少临时数据（KV Cache）的内存占用。通过内存优化，DeepSeek-V3 的 KV 缓存大小每 token 仅需 70 KB，是传统方法的 1/7 至 1/4，从而大幅降低显存压力。
2、采用 DeepSeek-MoE（混合专家架构）进行计算优化。DeepSeek-V3 凭借 MoE 单次推理只激活部分参数的思路，训练成本仅为同规模稠密模型的 1/10。并且得益于激活参数减少，V3 能够在消费级 GPU 上运行，并达到每秒生成近 20 个 toeken。
3、通过 FP8 低精度训练，将模型所需内存占用和计算量减半，并通过「精细量化」保持精度要求。DeepSeek-V3 通过 FP8，训练成本成功降低 50%，精度损失小于 0.25%。
4、通信方面，DeepSeek-V3 采用了多层胖树网络（Multi-Plane Fat-Tree），避免不同任务流量冲突；在模型推理时，还将「注意力计算」和「专家间通信」分阶段执行，利用流水线并行（DualPipe）让 GPU 在计算时同时传输数据。
5、推理加速方面，DeepSeek-V3 使用多 token 预测（MTP）的方法，将模型生成速度提升了 1.8 倍，同时保持准确率在 80%-90%。另外，DeepSeek 团队还对未来 AI 发展的多维度进行了展望，有「CPU 与 GPU 通信瓶颈」「低精度计算支持」「系统鲁棒性挑战」「内存系统优化」等方面内容。

技术报告原文可以访问：https://arxiv.org/pdf/2505.09343

分享到:

09:44

MiniMax 发布全新文转语音模型，超越 OpenAI

据爱范儿消息，5 月 15 日，MiniMax 稀宇科技宣布，其基于 AR Transformer 模型研发的高质量 TTS 系统「MiniMax Speech 02」正式公布。
据悉，MiniMax Speech 02 具有足够强的泛化能力，能够轻松驾驭 32 语种、不同口音、不同情绪的人声。
在性能表现上，MiniMax Speech 02 在两项全球权威语音基准测评榜单（Artificial Analysis Speech Arena 和 Hugging Face TTS Arena）中，超越 OpenAI、ElevenLabs 等全球性能优异的模型，双双位列第一。
另外，根据 Arena 榜单的 ELO 评分结果显示，从用户体验上， MiniMax Speech 02 的听感更加优异。同时该模型系统还做到了价格更低，分别是 ElevenLabs Flash V2.5 与 Mutilingual V2 的一半与四分之一。
目前，MiniMax Speech 02 已上架 MiniMax Audio，并且公布了技术细节、实验对比数据、开源的多语言测试集，以及技术报告。

分享到:

09:42

OpenAI CEO 预告新产品

据爱范儿消息，今日凌晨，OpenAI CEO Sam Altman 发文预告称，不久后 OpenAI 团队将发布一个低调的研究预览，并表示将会给该研究预览起一个「比 ChatGPT 更好」的名字，以防止过于火爆。
近期，Altman 参加投资机构红杉资本的「2025 AI Ascent」大会，其在问答环节时指出，尽管 OpenAI 没有明确的「总体规划」，但团队希望开发出一种类似于订阅式操作系统的 AI 产品，并构建一个能够整合「用户一生中所触及到」的模型。
另外，在被问及 OpenAI 对于「如何使用其正在寻求的巨额投资」是否有明确计划时，Altman 回答称，团队将努力打造出色的模型，推出优质的产品，除此之外并无其他总体规划。

分享到:

09:41

Anthropic 将在未来几周推出两款新的 Claude 系列推理模型

据 The Information 消息，Anthropic 将在未来几周推出两款新的 Claude 系列推理模型。
据知情人士透露，两款新模型分别为 Claude Sonnet 系列和 Claude Opus 系列。
据悉，两款新模型能够从「思考」与「探索」两种模式之间自由切换，从而来满足解决问题的最佳方式；另外，新模型还将支持「工具使用」，即调用外部工具、App 和数据库来寻求答案。值得一提的是，其中有一款模型若在使用工具解决问题时「卡壳」，它可以回到「推理」模型来思考相关问题并进行自我修正。
报道指出，这对新模型生成代码来说很实用，因为模型能够自我检查一遍以减少程序出错。上月，Claude 宣布上线 Research 功能和 Google Workspace 深度集成。而上述两个功能都多少离不开 Agent 和 MCP 协议的关联。其中，Claude 的 Research 拥有代理式（Agentic）搜索框架，支持自主规划并执行多步骤搜索任务；而 Claude 集成的 Google Workspace 依靠 Anthropic 的 MCP 协议。

分享到:

09:39

宇树科技申请多枚机器人牌照商标

据36氪消息，近日，杭州宇树科技有限公司申请注册“机器人牌照”“机牌”“Robot license”“Robot plate”等商标，国际分类涉及科学仪器、运输工具、广告销售等，当前商标状态均为等待实质审查。
杭州宇树科技有限公司成立于2016年8月，法定代表人为王兴兴，注册资本约259.42万元人民币，由王兴兴、汉海信息技术（上海）有限公司、宁波红杉科盛股权投资合伙企业（有限合伙）等共同持股。

分享到:

09:36

OpenAI宣布向ChatGPT用户开放GPT-4.1模型

据界面新闻消息，北京时间5月15日凌晨，美国OpenAI宣布，应广大用户的要求，GPT-4.1即日起将直接在ChatGPT中提供。
GPT-4.1是一款专攻编码任务和指令遵循的专用模型。Plus、Pro和Team用户将能够通过模型选择器中的“更多模型”下拉菜单访问GPT-4.1。
企业版和教育版用户将在未来几周内获得访问权限。
OpenAI还将推出GPT-4.1 mini替代现有的GPT-4o mini，该版本将在ChatGPT中向所有用户开放。

分享到:

09:35

谷歌Deepmind发布用于设计高级算法的编程AI Agent

据财联社消息，谷歌Deepmind在官网发布了用于设计高级算法的编程AI Agent——AlphaEvolve。
值得一提的是，谷歌在展示AlphaEvolve的能力时，就特意找了一道300多年的数学难题——亲吻数问题。
这道题的历史最早可以追溯到1694年，牛顿还和别人辩论、研究过。其难点在于给定维度的空间中，最多可以有多少个相同大小的球体同时接触一个中心球体，这些球体之间不发生重叠。而AlphaEvolve发现了由593个外层球体组成的结构型，并在11维空间中建立了新的下界，超越之前数学家们创造的记录。

分享到:

09:05

Manus 辟谣「母公司拟以 15 亿美元估值融资」

据爱范儿消息，昨日，有消息称 Manus AI 母公司「蝴蝶效应」拟以 15 亿美元估值进行融资，规模 1 亿美元。
该消息出现后，Manus AI 官方发文回应否认了该消息：此消息严重失实，目前公司正专注产品研发和用户体验。对于此虚假消息可能造成的侵害，本公司保留法律追究的权利。
但据彭博社上个月援引知情人士消息， Manus AI 近期完成一轮融资，由硅谷风投公司 Benchmark 领投，融资金额达 7500 万美元（约合 5.46 亿人民币）。此次融资让 Manus AI 的估值提升至近 5 亿美元（约合 36.44 亿人民币），这一估值比之前的估值增长了约五倍。
除了 Benchmark，还有多家现有投资方参与了此轮融资。Manus 背后的初创公司「蝴蝶效应」表示，这笔资金将用于将其服务拓展至美国、日本和中东等海外市场。

分享到:

09:03

Poe：DeepSeek 使用率下降 50%

据爱范儿消息，日前，大模型整合应用平台 Poe 发布了《2025 年春季 AI 模型使用趋势报告》，具体来看：
DeepSeek 的「病毒式」传播有所减弱，其使用率从 2 月的峰值 7% 降至 4 月底的 3%，整体使用率下降超过 50%；
OpenAI 凭借其在 GPT-4o 中推出新的文生图生成器后，通过「吉卜力风格」「仿真自拍」等热点玩法，实现了「病毒式」使用率增长；
快手的视频生成模型「可灵」在发布 Kling-2.0-Master 后，用短短三周时间获得了 21% 的 Poe 视频生成占有率。
Poe 还在报告中提到，发送给 Poe 内的推理模型的消息文本份额，从约 2% 增加至约 10%，其中 DeepSeek「病毒式」传播期间达到了峰值。
另外，Poe 订阅者对 Gemini 2.5 Pro 的使用正在迅速增长，该模型在发布仅约 6 周内就获得了约 30% 的推理消息份额。

具体报告：https://poe.com/zh/blog/spring-2025-ai-model-usage-trends

分享到:

09:02

OpenAI 开放 GPT-4.1 使用

据爱范儿消息，今日凌晨，OpenAI 宣布开放旗下 GPT-4.1 模型，现已支持在 ChatGPT 中使用。
GPT-4.1 系列包含三个版本：GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano，三者均支持高达 100 万 token 的上下文窗口，相比 GPT-4o 的 12.8 万 token 实现大幅提升。
在多方面表现上，GPT-4.1 相较于 GPT-4o 都有了不小提升，GPT‑4.1 mini 在多项测试中甚至超越 GPT-4o，在保持与 GPT‑4o 相似或更高智能表现的同时，延迟几乎减半，成本降低了 83%。
目前，Plus、Pro 和 Team 用户已开放使用 GPT-4.1，企业和教育用户将在未来几周内获得访问权限。
另外，OpenAI 还在 ChatGPT 中为所有用户推出 GPT-4.1-mini，以取代 GPT-4o-mini。

分享到:

AI快讯

DeepSeek 公布 V3 降本技术，梁文锋参与

MiniMax 发布全新文转语音模型，超越 OpenAI

OpenAI CEO 预告新产品

Anthropic 将在未来几周推出两款新的 Claude 系列推理模型

宇树科技申请多枚机器人牌照商标

OpenAI宣布向ChatGPT用户开放GPT-4.1模型

谷歌Deepmind发布用于设计高级算法的编程AI Agent

Manus 辟谣「母公司拟以 15 亿美元估值融资」

Poe：DeepSeek 使用率下降 50%

OpenAI 开放 GPT-4.1 使用

联系我们