来源:福布斯 作者:Giovanni Malloy

人工智能正在为体育媒体界最具标志性的合作之一注入新活力:NBA 与 NBC 携手合作。去年夏天,双方签署了一份为期 11 年的新协议,让 NBA 赛事重返 NBC 环球旗下的 NBC、Telemundo 电视台及流媒体平台 Peacock。
如今,NBC 为这次回归增添了情感与技术层面的亮点:宣布将通过 AI 技术,在宣传和直播中使用吉姆・法甘(Jim Fagan)的声音。法甘深沉的男中音曾是迈克尔・乔丹时代 NBA 转播的标志。尽管他已于 2017 年去世,但其声音将再次为宣传片、片头序列和特定节目旁白。
吉姆・法甘的声音重返 NBC NBA 转播
吉姆・法甘是 NBA 迈克尔・乔丹时代的代名词。1990 年至 2002 年,他富有感染力的声音成为 NBC 转播中无数经典时刻的 “开场白”。作为令人难忘的 “这里是 NBC 的 NBA” 开场白的旁白,法甘的语调为史诗级对决、总决赛巅峰战,以及沙奎尔・奥尼尔、哈基姆・奥拉朱旺和科比・布莱恩特等全球巨星的崛起奠定了情感基调。他的声音与 90 年代 NBA 的暴扣和激烈防守一样,成为那个时代篮球体验的一部分。
NBC 今日早些时候发布了一支预告视频,其中 AI 生成的吉姆・法甘声音搭配了一段精彩的比赛高光混剪。此外,NBC 还重新获得了约翰・泰什(John Tesh)创作的主题曲《Roundball Rock》的版权。随着这首主题曲与吉姆・法甘 AI 重现的声音一同回归,NBC 不仅是在复活旧资产,更是在重塑定义了一代篮球观众的文化时刻。
NBC 此前的 AI 声音尝试
这并非 NBC 首次涉足 AI 生成画外音。法甘的宣布是其将 AI 融入叙事的更广泛计划的一部分。在 2024 年夏季奥运会期间,观众可以观看由阿尔・米歇尔斯(Al Michaels)旁白的个性化每日精彩集锦。NBC 使用 AI 生成的阿尔・米歇尔斯声音获得了显著积极的反响。
《华盛顿邮报》的一篇评论指出,阿尔・米歇尔斯的 AI 声音 “出人意料地逼真”,尽管合成声线比原版略显平淡,但有效捕捉了米歇尔斯独特的节奏和表达方式。AI 甚至能正确念出复杂的运动员名字,提升了不熟悉某些运动项目的观众的观看体验。
AI 声音克隆技术原理
AI 生成声音依赖于人工智能的一个分支 —— 神经文本转语音(Neural TTS),它利用深度学习从文本合成类人声语音。这一过程的核心是一个通过数百或数千小时真实语音录音训练的机器学习模型。这些录音不仅教会 AI 一个人的音色,还包括其语速、情感表达、重音甚至说话时的呼吸节奏。
要重现特定个人的声音,公司通常使用一种称为 “声音克隆” 的技术,即向 AI 模型输入该人的大量存档音频数据集,使其学习声音的细微差别和语调变化。然后,模型根据新的文本输入生成模仿说话者语气和风格的语音。NBC 使用的先进系统通常包括音素级对齐(捕捉语音的单个音素)和韵律建模(模仿人类的音高、响度、节奏和韵律),使输出听起来更少机械感、更自然。
人工监督在此过程中可能起到关键作用:编辑团队会审核脚本,确保发音准确(尤其是国际运动员的名字),并微调语调。
这对体育转播未来的意义
过去几年,NBA 在 AI 和数据分析领域不断迈进。当 NBC 准备重启 NBA 转播时,使用吉姆・法甘这样的 AI 生成声音不仅是技术噱头。通过将熟悉声音的情感共鸣与 AI 的灵活性结合,电视网正在探索深化球迷参与度、以前所未有的方式扩展叙事的新途径。如果《Roundball Rock》和法甘声音的回归预示着什么,那就是:当怀旧与创新结合,可能成为体育转播新时代的基石。
本文转载自福布斯,本文观点不代表雅典娜AI助手YadiannaAI立场。