来源:CIO 作者:Thor Olavsrud

从人工智能聊天机器人和虚拟助手到音频和视频生成器,这些是当今使用的领先一代人工智能工具。
自2022年OpenAI首次推出ChatGPT以来,生成人工智能已经大放异彩地进入企业。根据Precedence Research的数据,2024年全球人工智能市场超过250亿美元,预计到2033年将达到惊人的8030亿美元。沃顿的人工智能是UPenn沃顿学院沃顿人工智能和分析计划的一部分,与咨询公司GBK Collective一起,在对高级决策者的一项研究中也发现,拥有1000名或以上员工的企业在2024年对人工智能的投资平均是2023年的两倍多。
但德勤最近的一项调查发现,尽管大多数总监到C-suite级别的受访者有试点或实施 Gen AI计划的经验,以增加下一个财政年度的总体AI支出,但他们的做法有所缓和,预计在未来几个月内,只有30%或更少的Gen AI实验会完全扩展——这反映了他们掌握的工具。因此,鉴于当前的获取和采用环境,以下是目前企业中最常用的10种人工智能工具。
ChatGPT
OpenAI的ChatGPT是一个建立在生成预训练(GPT)模型之上的聊天机器人应用程序。它于2022年推出,是企业中使用最多的一代人工智能工具,最近沃顿调查的受访者中,62%的人表示他们目前使用它,28%的受访者表示他们目前没有使用它,但正在评估或测试它。
ChatGPT的优势在于自然语言理解和生成,使其成为应对复杂语言挑战的绝佳工具,包括自动化和增强客户服务,通过处理重复查询来简化操作,生成报告,起草电子邮件和创建产品描述。
像所有一代人工智能一样,ChatGPT的准确性可能有所不同,它无法理解情绪在某些情况下会导致问题。可能需要人工监督和干预。
Microsoft Copilot
Microsoft Copilot是嵌入Microsoft 365的对话聊天界面,用于提高Word、Excel、PowerPoint、Outlook和Teams等应用程序的生产力。它于2023年推出,利用OpenAI的GPT-4基础LLM,是第二大使用的Gen AI工具。根据沃顿的调查,52%的受访者表示他们的企业目前使用Copilot,35%表示他们正在评估或测试它。
Copilot的优势在于它与Microsoft 365环境中员工全天使用的生产力应用程序的集成。它遵守企业已经制定的安全、合规和隐私政策,并可作为现有微软许可证的附加组件使用。用途包括:
- 在Word中起草文档和总结文本
- 从Excel中的现有数据生成图表
- 在PowerPoint中创建大纲和设计幻灯片
- 管理您的Outlook收件箱、总结电子邮件主题和起草回复
- 总结团队会议的要点并创建行动项目
- 利用Power BI使用自然语言查询创建报告和视觉效果
与ChatGPT一样,副驾驶的准确性并不完美。例如,在总结内容时,它可能会忽略要点或忽略关键细节。同样,即使借鉴品牌材料、文案和图像,其输出也不一定符合品牌标准。用户需要密切关注输出。
Google Gemini
Google Gemini(前身为Bard)是一个基于谷歌的多模态人工智能模型家族的对话聊天机器人。沃顿发现,40%的调查受访者目前正在使用Gemini,39%正在评估或测试它。
与ChatGPT和Microsoft Copilot相比,2023年推出的Gemini在多模态功能方面处于早期领先地位——除了文本之外,还可以处理和生成图像、音频和视频。Gemini与Gmail、Docs和Slides等Google Workspace工具集成。
Gemini的潜在用途包括:
- 根据Smart Email Composer的提示起草电子邮件
- 根据提示在谷歌幻灯片中创建幻灯片
- 通过电子表格分析器识别谷歌表格中的趋势、离群值和相关性
- 为Google Meet视频会议生成背景插图和模拟专业照明,甚至改善音频体验
Gemini与Google Workspace的集成使其成为使用Workspace但在此类环境之外的实用性有限的环境中的绝佳工具,因为它在Google的安全环境中运行。与ChatGPT和Copilot一样,准确性可能是一个问题,建议人工监督其输出。
Meta AI
Meta AI是Meta的多模态AI助手,适用于公司的消息传递和社交媒体应用程序,包括Facebook、Instagram、WhatsApp和Messenger。与Gemini一样,沃顿调查的受访者中有40%表示他们目前使用Meta AI,而36%表示他们正在评估或测试它。
由Meta的Llama LLM提供支持,用户可以利用Meta AI在公司的应用程序中提供建议、回答问题、编辑图像和提供翻译。企业可以使用Meta AI来设置虚拟助手,这些助手可以:
- 自动化客户互动,包括回答问题和提供个性化建议
- 促进Meta应用程序中的商务
- 分析数据,帮助企业创建有针对性的营销活动
Meta AI已经与许多客户花大部分时间上网的应用程序集成在一起,但访问客户数据具有潜在的隐私和道德影响。
Dall-E 3
Gen AI不仅仅是关于聊天机器人和虚拟助手。DALL-E 3同样来自OpenAI,专注于从文本描述中生成视觉效果,沃顿调查中30%的受访者表示他们目前使用DALL-E 3,35%表示他们正在评估或测试它。OpenAI在2021年推出了最初的DALL-E模型,DALL-E 3深度学习模型利用计算机视觉和自然语言处理来创建视觉效果。潜在的功能用途包括产品创意、应用程序模型、图标设计、为社交媒体帖子创建图像和视频以及教育材料。
在人工智能图像生成器中,DALL-E 3的优势在于它与ChatGPT的集成,但许多用户表示,它与逼真主义作斗争,具有独特的风格,可以轻松发现模型生成的图像。
RunwayML Gen-1和Gen-2
Runway使用文本、图像和视频输入(包括其他Gen AI工具生成的内容)来生成视频,沃顿调查中25%的受访者表示他们目前使用Gen-1和Gen-2,而31%表示他们正在评估或测试这些模型。
Gen-2型号于2023年发布(Gen-4型号于4月发布),扩展了Gen-1型号的功能,允许创建长达18秒的视频。用户可以指导相机的移动来自定义内容,也可以将剪辑拼接在一起以创建更长的视频。除其他事项外,企业可以使用该工具为静态资产、视觉效果和故事板动画化。
跑道在某些功能方面有陡峭的学习曲线,并且可以是资源密集型的。
Stable Diffusion
Stable Diffusion于2022年发布,是Stable人工智能的深度学习模型,它从文本和图像提示中生成高分辨率、逼真的图像。它还可以创建视频和动画,24%的沃顿调查受访者表示他们目前使用Stable Diffusion,33%表示他们正在评估或测试它。
基于比一些竞争对手少得多的处理能力的潜在扩散模型上,Stable Diffusion能够在带有消费级GPU的台式机和笔记本电脑上运行,而不是局限于云服务。
Stable Diffusion的潜在业务用途包括医学成像、为目录生成视觉效果、设计数字原型、生成概念艺术和故事板,以及图像编辑,包括色彩校正和降噪。
Midjourney
Midjourney是一个从自然语言提示中生成图像的工具。沃顿调查于2022年推出开放测试版,23%的受访者表示他们目前使用Midjourney,32%表示他们正在评估或测试它。
Midjourney可以通过Discord通信平台或该工具的官方网站访问。
通过Midjourney商业许可创建的图像可以用于商业用途,但除非由人类进行重大改造,否则不能受版权保护。因此,由Midjourney创作且未由人类艺术家转换的图像被视为公共领域。
Perplexity
Perplexity由Perplexity AI于2022年推出,是一个由人工智能驱动的搜索引擎,利用LLM来处理查询和综合回复,21%的沃顿调查受访者表示他们目前使用Perplexity,33%表示他们正在评估或测试它。
Perplexity建立在Microsoft Azure上。免费版本利用了OpenAI的GPT-3.5 LLM,但付费用户可以选择他们的型号。用途包括:
- 内部搜索,同时在网络和内部文档中搜索内容
- 金融,包括实时股票报价、价格跟踪、行业同行比较和基本财务分析工具
- Perplexity Assistant,一款适用于安卓设备的人工智能搜索助手
Claude
Claude是Anthropic在2023年发布的对话式人工智能聊天机器人,19%的沃顿调查受访者表示目前正在使用Claude,而34%的人表示他们正在评估或测试它。
Claude依靠Anthropic开发的Constitutional AI(CAI)原则,这是一种培训AI系统的方法,旨在解决有关透明度、安全和决策的担忧,而不依赖人类反馈。CAI旨在赋予Claude道德界限,如果它判断回复会造成伤害,其能够拒绝回答查询。
作为ChatGPT等其他通用产品的替代方案,企业可以使用Claude实现自动化和增强客户服务,通过处理重复查询来简化运营,生成报告,起草电子邮件和创建产品描述。
本文转载自CIO,本文观点不代表雅典娜AI助手YadiannaAI立场。