LLM
-
开源视觉语言模型 Kimi-VL 发布
来源:爱范儿 4 月 11 日,月之暗面 Kimi 正式发布旗下开源视觉语言模型 Kimi-VL。该模型具体参数如下:语言模型部分,采用了 Kimi 前一段时间发布的轻量级 MoE 模型 Moonlight,16B 总参数,2.8B 激活参数;视觉信息处理部分,采用了支持原生分辨率的 MoonViT 编码器 —— 400M 参数 Vison Transfor…
-
在部署大型语言模型LLM前需要考虑的5件事
来源:InfoWorld 作者: Andrew C. Oliver 大型语言模型已成为科技的最新锤子,但并非每个问题都是钉子。提交前请回答这些关键问题。 如果螺丝刀是由当今科技行业发明的,那么它将被广泛用于各种任务,包括锤钉。自ChatGPT首次亮相以来,对大型语言模型(LLM)的热情和反对越来越大。事实上,该技术的许多改编似乎被挪用,其能力被高调,因为它经…
-
DSPy:一个用于构建LLM驱动应用的开源框架
作者:Serdar Yegulalp | 来源:InfoWorld 构建由大型语言模型(LLM)驱动的应用程序时,开发者常面临一个核心挑战:如何让LLM与其他机器学习模型及外部系统有效协作。来自斯坦福的研究团队推出的开源框架DSPy,正试图通过一种声明式编程方法解决这一问题。 什么是DSPy? DSPy(Declarative Self-Improving…
-
DeepSeek可能正是人工智能应用程序所需要的
来源:PitchBook 作者:Leah Hodgson 据PitchBook 报道,DeepSeek发布其r1推理模型的结果是使行业蓬勃发展,这家中国AI公司处于大多数风险投资和人工智能行业对话的最前沿。 芯片制造商Nvidia的股价仍然比DeepSeek公布其模型之前的1月初历史高价低15%左右。与此同时,人们对OpenAI和Mistral AI等基础模…