来源:《Quanta》杂志 作者:Steve Nadis

10 岁时,Rose Yu 收到了一份改变她人生 —— 也可能改变我们研究物理学方式的生日礼物:叔叔送她一台电脑。25 年前的中国,电脑还是稀罕物,这份礼物自然没有被闲置。起初,Rose Yu 主要用它玩电脑游戏,但中学时她就凭借网页设计获奖,这是她获得的首个与计算机相关的荣誉,此后类似的荣誉接踵而至。
Rose Yu 后来在浙江大学主修计算机科学,期间因创新研究获奖。研究生阶段,她选择了南加州大学(USC),部分原因是她在美国唯一认识的人 —— 那位叔叔当时正在附近帕萨迪纳的喷气推进实验室工作。2017 年,Rose Yu 获得博士学位,并摘得最佳博士论文奖。她的最新荣誉来自今年 1 月,时任美国总统拜登在任期最后一周授予她 “总统早期职业成就奖”。
如今身为加州大学圣地亚哥分校(UCSD)副教授的Rose Yu ,是 “物理引导深度学习” 领域的领军者。她多年来致力于将物理学知识融入人工神经网络,不仅为构建和训练这类系统引入了新方法,还在多个实际应用中取得进展。她借助流体动力学原理改进交通预测,通过加速湍流模拟增进人类对飓风的理解,还设计出帮助预测新冠病毒传播的工具。
这些工作让俞离她的宏大梦想更近一步 —— 打造一套名为 “AI 科学家”(AI Scientist)的数字实验室助手。她现在设想人类研究者与 AI 工具形成 “伙伴关系”,这种合作完全基于物理学原理,因而能够催生新的科学发现。在她看来,集合多个此类助手的输入,或许是推动科学发现进程的最佳方式。
《量子》杂志(Quanta)就湍流的多样表现、如何让 AI 发挥更大作用,以及 AI 如何缓解城市交通拥堵等话题采访了Rose Yu 。以下是经过精简和编辑的访谈内容。
你最初何时尝试将物理学与深度学习结合?
一切始于交通问题。我在南加州大学读研究生时,校园紧邻 10 号和 110 号州际公路的交汇处,去哪里都要遭遇严重堵车,非常烦人。2016 年,我开始思考能否做点什么改变这种状况。
当时,利用多层神经网络从数据中提取模式的深度学习正炙手可热,图像分类等应用已引发大量关注,但图像是静态的。我想知道深度学习能否解决动态变化的问题。虽然并非首个考虑这个方向的人,但我和同事确实找到了一种全新的问题构建方式。
你们的新方法是什么?
首先,我们从扩散的物理过程角度看待交通。在模型中,道路网络上的交通流类似于表面上的流体流动,其运动受流体动力学定律支配。但我们的主要创新是从图论的数学视角将交通视为 “图”:监测公路交通的传感器作为图的节点,节点之间的边代表连接它们的道路(及距离)。
图能呈现某一时刻整个道路网络的快照,显示图中每个点的平均车速。将每 5 分钟间隔的一系列快照串联起来,就能清晰展现交通的演变过程,进而预测未来趋势。
深度学习的一大挑战是需要大量数据训练神经网络。幸运的是,我的导师赛勒斯・沙哈比(Cyrus Shahabi)研究交通预测多年,积累了海量洛杉矶交通数据供我使用。
你们的预测效果如何?
在我们的研究之前,人们只能做出约 15 分钟内可靠的交通预测,而我们的预测有效期可达 1 小时,进步显著。我们的代码于 2018 年被谷歌地图采用,后来谷歌邀请我担任访问研究员。
大约就在那时,你开始涉足气候模型研究,对吗?
是的,2018 年我在劳伦斯伯克利国家实验室演讲后,与那里的科学家交流,寻找适合物理引导深度学习的测试问题,最终选定了预测湍流演变。湍流是气候模型的关键因素,也是存在重大不确定性的领域。
常见的湍流例子如往咖啡里倒牛奶并搅拌后形成的漩涡,而海洋中的此类漩涡可能跨度达数千英里。基于描述流体流动的纳维 – 斯托克斯方程进行的湍流预测,被视为该领域的黄金标准,但所需计算极其缓慢,这也是我们缺乏飓风和热带气旋良好预测模型的原因。
深度学习能提供帮助吗?
基本思路是:通过最佳数值模拟数据训练的深度神经网络,能够学习 “模仿”(或称为 “模拟”)这些模拟过程,方法是识别数据中隐含的属性和模式,无需通过耗时的暴力计算寻找近似解。我们的模型在二维场景中使预测速度提升 20 倍,三维场景中提升 1000 倍。类似的湍流预测模块未来或许能嵌入更大的气候模型,改进飓风等天气现象的预测。
湍流还出现在哪些领域?
几乎无处不在。例如,血流中的湍流可能引发中风或心脏病发作。我在加州理工学院做博士后时,合著过一篇关于无人机稳定的论文:螺旋桨产生的气流与地面相互作用会引发湍流,导致无人机晃动。我们用神经网络对湍流建模,从而改善了无人机起降时的控制。
我目前正与加州大学圣地亚哥分校和通用原子公司的科学家合作研究核聚变。成功的关键之一是学会控制等离子体(一种高温电离物质状态)。在约 1 亿摄氏度的高温下,等离子体内会产生各种湍流,而基于物理的数值模型描述这种行为的速度非常慢。我们正在开发一种深度学习模型,希望能在瞬间预测等离子体行为,但这项工作仍在进行中。
“AI 科学家” 的想法从何而来?
过去几年,我的团队开发了能从数据中自动发现对称性原理的 AI 算法。例如,算法识别出了与光速不变相关的洛伦兹对称性,还识别出旋转对称性(如球体旋转后外观不变)—— 而这些并非算法专门训练的内容。虽然这些是已知属性,但我们的工具也有能力发现物理学中尚未知晓的新对称性,这将是重大突破。
由此我想到,既然工具能从原始数据中发现对称性,为何不将其推广?它们还可以生成科学研究思路或新假设。这就是 “AI 科学家” 的起源。
“AI 科学家” 究竟是什么?只是一种花哨的神经网络吗?
它不是单一的神经网络,而是一套帮助科学家实现新发现的计算机程序集合。我的团队已开发出辅助特定任务的算法,比如天气预报、识别全球变暖驱动因素,或发现疫苗政策对疾病传播的因果关系等。
我们正在构建更广泛的 “基础” 模型,使其能处理多种任务。科学家从各类仪器收集数据,我们希望模型能涵盖数字、文本、图像、视频等多种数据类型。目前已有早期原型,但我们希望在发布前让模型更全面、智能,训练更充分,这可能在未来几年内实现。
你设想它能发挥什么作用?
AI 几乎可以辅助科学发现过程的每一步。我说的 “AI 科学家”,其实是 AI 科学助手。例如,实验中的文献调研阶段通常需要大量数据收集和整理,而大型语言模型能在一顿午餐时间读完并总结数千本书。但 AI 不擅长判断科学有效性,在这一点上无法与经验丰富的研究者竞争。AI 可以辅助生成假设、设计实验和分析数据,但仍无法独立开展复杂实验。
你希望这个概念走多远?
在我的想象中,“AI 科学家” 能帮研究者摆脱一些繁琐工作,让人类专注于科学的创造性部分 —— 这正是我们的专长。放心,目标绝非取代人类科学家。我从未设想,也绝不希望看到机器替代或干扰人类的创造力。
本文转载自《Quanta》杂志,本文观点不代表雅典娜AI助手YadiannaAI立场。