人工智能预测分子中电子的分布并计算其物理性质。图片来源:DeepMind
英国人工智能公司DeepMind的科学家团队开发了一个机器学习模型,可以通过预测分子中电子的分布来显示分子特征,该模型比现有技术更能准确地计算某些分子性质。相关研究结果发表于12月10日《科学》。
波兰罗兹理工大学计算化学家Katarzyna Pernal说,这篇论文是一篇“坚实的作品”。但她认为,机器学习模型要想对计算化学家有用,还有很长的路要走。
原则上,材料和分子的结构完全由量子力学决定,特别是由控制电子波函数行为的薛定谔方程决定。这些都是数学上的小工具,用来描述在空间中某个特定位置发现特定电子的概率。论文通讯作者之一、DeepMind物理学家James Kirkpatrick表示,因为所有的电子都相互作用,所以根据这种第一原理计算结构或分子轨道是一场计算上的噩梦,而且只能对最简单的分子(如苯)进行计算。
研究人员几十年来一直依靠一套称为密度泛函理论(DFT)的技术来预测分子的物理性质。该理论并不试图对单个电子进行建模,而是旨在计算电子负电荷在分子中的总体分布。Kirkpatrick说:“DFT研究的是平均电荷密度,所以它不知道单个电子是什么。从这个密度可以很容易地计算出物质的大多数特性。”
自20世纪60年代诞生以来,DFT已成为物理科学中应用最广泛的技术之一:2014年《自然》的一项调查发现,在100篇被引用最多的论文中,有12篇是关于DFT的。现代材料属性数据库,如材料项目,在很大程度上由DFT计算组成。
但是这种方法也有局限性。虽然DFT计算比从基本量子理论开始的计算效率要高得多,但它们仍然很麻烦,而且通常需要超级计算机。因此,在过去十年中,理论化学家越来越多地开始进行机器学习实验,特别是研究材料的化学反应性或导热能力等性质。
DeepMind团队可能已经做出了迄今为止最雄心勃勃的尝试,部署AI来计算电子密度,这是DFT计算的最终结果。论文通讯作者之一、DeepMind长期从事DFT研究的理论化学家Aron Cohen表示,这是机器学习的一个理想问题:你知道答案,但不知道你想要应用的公式。
该团队根据1161个薛定谔方程精确解的数据训练了一个人工神经网络。为了提高准确性,他们还将一些已知的物理定律硬连接到网络中。奥地利维也纳大学材料科学家Anatole von Lilienfeld介绍,随后他们在一组经常用作DFT基准的分子上测试了经过训练的系统,结果令人印象深刻。
von Lilienfeld补充道,机器学习的一个优点是,尽管训练模型需要大量的计算能力,但这一过程只需完成一次。与每次从头开始计算相比,个人预测可以在普通笔记本电脑上完成,大大降低了成本和碳足迹。
该研究作者透露,DeepMind正在向其他人发布他们经过训练的系统。目前,该模型主要适用于分子,而不是材料的晶体结构,但未来的版本也可能适用于材料。
相关论文信息:https://doi.org/10.1126/science.abj6511
热门