据爱范儿消息,日前,英伟达推出了 Llama-Nemotron 系列最新的三款模型,分别为「LN-Nano 8B」「LN-Super 49B」和「LN-Ultra 253B」。
其中,LN-Ultra 模型通过大规模强化学习(RL)进一步超越了教师模型 DeepSeek-R1,成功突破了性能瓶颈。
LN-Ultra 还能在单个 8xH100 节点上运行,并具备更高的推理吞吐量。英伟达还首次推出了推理开关功能,允许用户通过简便的指令在「标准聊天模式」和「推理模式」之间动态切换,满足日常对话与复杂推理任务的需求。
性能表现上,LN-Nemotron 系列模型在多个基准测试中取得了领先表现,尤其在推理任务(如 GPQA-Diamond、AIME24、AIME25)和非推理任务(如指令遵循评估)上均显示出了卓越的能力。LN-Ultra 不仅超越了 DeepSeek-R1,还在多个领域的应用上展现了强大的泛化能力。
值得一提的是,本次 LN-Super 和 LN-Ultra 模型采用了 Puzzle 框架,以优化推理效率。该框架利用局部蒸馏和模块化优化,实现了在硬件限制下的高效推理。在 LN-Ultra 中,研究者还引入了 FFN Fusion 技术,显著提升了推理延迟效率。