本报讯 最近,中国科大微尺度物质科学国家研究中心江俊教授,与罗毅教授和美国加州大学尔湾分校Shaul Mukamel教授合作,通过利用人工智能机器学习中的神经网络技术,模拟了蛋白质肽键结构与性质之间的构效关系,将计算量一下降低了上万倍。最后他们成功地预测了肽键紫外光谱,还用随机森林的办法揭示了具有化学内涵的结构描述子和构效关系。人工智能与量子化学理论计算的结合,为预测蛋白质的光学特性提供了一种高效的工具。相关成果发表在《美国科学院院报》。
蛋白质是生命的基石,生物的功能依赖于既稳定而又灵活可变的蛋白质结构。蛋白质的光谱响应信号,尤其是紫外光谱,可以称之为蛋白质骨架的“指纹”。这个“光学指纹”,经过理论模拟的解读,可以揭示出精确的蛋白质结构,为生命科学和医学诊断提供极其重要的信息。
然而,蛋白质的结构极其复杂多变,需要做大量的高精度的量子化学理论计算。由于计算量太大,即使是最厉害的超级计算机轻易也“吃不消”。所以蛋白质的光谱的理论解读是一个长期的困难与挑战,限制了光谱的准确分析和蛋白质结构的发现。
怎么样在光谱理论模拟中避免太昂贵的量子化学计算,解读蛋白质骨架的 “光学指纹”,是一个重要的科学课题。而近年来,人工智能技术被广泛的应用到各个领域,用于大幅度降低复杂体系的计算量。
江俊课题组近些年致力于发展机器学习技术在量化领域的应用,努力探究使其成为解决量化问题的一种重要工具。在本工作中,研究人员首先在300K温度下通过分子动力学模拟以及量子化学计算,得到了五万组不同构型的肽键模型分子。
本项工作确立了机器学习模拟蛋白质肽键骨架紫外吸收光谱的可行性和优势,蛋白质的“光学指纹”解读也将会变得更加轻易和有效。
该论文第一作者为博士生叶盛与博士后胡伟、李鑫,江俊与Shaul Mukamel为共同通讯作者。
(合肥微尺度物质科学国家研究中心)