用机器学习算法解决密度泛函问题若成功,药
2023/5/3 来源:不详白癜风的药物涂抹 http://m.39.net/pf/a_5897881.html
如果科学家们能够了解电子在分子中的活动,那么他们就能够预测一切事物的行为,包括实验药物与高温超导体。
作者
吴彤
编辑
陈彩娴
「AI+X」愈发如火如荼。
最近,权威学术媒介QuantaMagazine发表了一篇文章,介绍了DeepMind在内的许多研究团队正使用机器学习算法攻破物理领域的一个著名难题——密度泛函理论。
他们企图通过机器学习算法来寻找第三级密度泛函的方程式,找出人类无法用数学描述的电子行为,从而突破电子在分子中的活动细节。这对药物发现、超导研究与奇异材料的研究意义重大。
在科学家们看来,这是一项重要的、振奋人心的研究,因为密度泛函理论是一个经典的量子力学理论,而从密度泛函出发,他们有望在分子与化学等相关领域取得重大突破,实现人工智能跨界共舞的又一传说。
那么,机器学习算法与物理如何能共舞呢?我们来看看QuantaMagazine的要点介绍。
1密度泛函理论是什么?
密度泛函理论的英文名为「DensityFunctionalTheory」,简称「DFT」,始于年代,是一种研究多电子体系下电子结构的方法,在物理与化学上有广泛的应用,尤其用来研究分子和凝聚态性质,是凝聚态物理计算材料学和计算化学领域最常用的方法之一。
这样说似乎还有点抽象。举一些形象的例子:
众所周知,近年来超算出奇迹。而年美国超级计算机集群的三大应用,排名第一的便是密度泛函,其次才是夸克和其他亚原子粒子的研究,气候模拟也只能排第三。
更往前一点,年10月,Nature整理出篇有史以来引用数量最高的研究论文,其中有12篇论文都与密度泛函理论有关。这是Nature当时的描述是:
「我们地球世界中的一切事物都取决于电子的运动——因此,DFT就是一切的基础。」
图注:密度泛函理论揭示了电子在分子(如2,3-(S,S)-二甲基环氧乙烷)中的活动
几十年来,研究人员利用DFT对事物进行预测:年,化学家ChristopherHHendon等人用DFT理论量化物种常见的咖啡酸、咖啡因与代表性风味成分丁香酚的热力学结合能,由此掌握了咖啡味道形成的奥妙;年,天文学家又用DFT理论预测木星核心的稠度,相关论文发表在了顶刊《GeophysicalResearchLetters》上。
英国牛津大学的材料物理学家FelicianoGiustino评价:「本质上,DFT是一种使不可能的数学变得简单的近似。」
要通过考虑每个电子和每个原子核如何与每个电子和原子核相互作用来研究硅晶体中的电子行为,研究人员需要分析16万亿()TB的数据,这远远超出了任何人的处理能力。而计算机将DFT的数据需求减少到只有几百KB,完全在标准笔记本电脑的容量范围内。这昭示了计算机科学与DFT的合作基础。
另一方面,DFT为科学家们提供了一条捷径,可以预测电子的去向,进而预测原子、分子和其他披着电子的物体将如何行动。长期以来,物理学家和化学家一直利用深厚的物理专业知识来使他们的方程式更好地反映所有电子共有的复杂活动。
了解电子就是了解它们构成的原子、分子和材料。自年代欧文·薛定谔发表他的同名方程(「薛定谔波动方程」)以来,物理学家已经彻底理解了电子。
图注:薛定谔波动方程
但在分析大量电子时,薛定谔方程几乎毫无用处,原因就在于电子比粒子更多团。它们在空间中扩散,以多种方式与其他电子重叠并相互挤压。随着电子数量的增加,使用薛定谔波动方程来解释所有电子之间的不断接触的难度也呈指数级增长。
来自加州大学伯克利分校的凝聚态物理学家杰弗里·尼顿(JeffreyNeaton)便提出这样的观点:「即使是只有几个粒子,你也需要用更多的磁盘空间才能把波函数写入硬盘。」
2从DFT到通用密度泛函
多年来,密度泛函理论的强大吸引着无数研究者躬身其中。在他们当中,我们不得不提到年获得诺贝尔化学奖的物理学家WalterKohn。
图注:WalterKohn
WalterKohn出生于奥地利维也纳,年获数学和物理学学士学位,年于多伦多大学获应用数学硕士学位,年在哈佛大学获博士学位。曾任哈佛大学物理系教员,卡内基-梅隆大学(CMU)助教和教授,加利大学圣地亚哥分校物理系教授、系主任,年到加利大学圣巴巴拉分校先后任理论物理所所长和物理系教授。
年,他与另一位物理学家PierreHohenberg找到了一种方法,证明通过将分子的电子粘在一起,形成一些点更厚、一些点更薄的液体,就可以完美地捕捉到分子的每一个方面。这种电子液体(electronsoup)的密度包含分子复杂波函数的所有信息,使物理学家实现了对电子进行单独的、原先以为绝无可能完成的任务。非常了不起。
图注:研究人员使用基于密度泛函理论的工具来预测DNA碱基对周围的电子在被激光脉冲击中时如何反应。
Hohenberg和Kohn证明了存在一个强大的主方程,即「通用密度泛函」。该方程将以「电子液体」为例计算其能量,引导物理学家采用能量最低且最自然的电子排列。从这个角度看,通用密度泛函具有很强的普遍性,原则上可以描述从硅砖到水分子的所有系统。
唯一的问题是没有人知道这个方程式是什么样的。
很快,年,Kohn和另一位物理学家LuJeuSham首次写出了可用的密度泛函方程式。在这个过程中,他们知道,想要写出捕捉电子行为所有微妙表现的精确函数难度极高,因此他们将难题一分为二:一半是已知部分,它提供了一组只能平均感知彼此的电子的能量;一半是未知部分,比如拜占庭量子效应和非局部相互作用产生的多余能量,统一放进一个被称为交换和相关函数的容差系数中。
论文链接: