分子模擬是物質(zhì)微觀結(jié)構(gòu)演化、光譜學(xué)模擬、材料構(gòu)效關(guān)系、化學(xué)反應(yīng)機(jī)理等科學(xué)研究的重要理論模擬工具。分子模擬的核心問題是根據(jù)原子幾何坐標(biāo)計算體系的勢能和勢能梯度,傳統(tǒng)上這類計算一般依賴經(jīng)驗勢方法或者第一性原理方法(如密度泛函方法DFT等)。一般來說,經(jīng)驗勢方法計算效率高,可用于大體系長時間過程的模擬,但模擬精度較低,且難以描述化學(xué)鍵的形成和斷裂等反應(yīng)過程;第一性原理方法具有較高的物理精度,可描述化學(xué)反應(yīng),但計算成本很高,模擬的空間尺度一般局限在兩三百原子以內(nèi),時間尺度局限在皮秒量級。因此,發(fā)展具有第一性原理級別模擬精度和經(jīng)驗勢級別計算資源需求的分子模擬方法,對大尺寸體系和長時間尺度的過程模擬(如相變、化學(xué)反應(yīng)等)至關(guān)重要。中國科學(xué)技術(shù)大學(xué)國家同步輻射實驗室XMCD線站團(tuán)隊的王超副研究員和中國科學(xué)技術(shù)大學(xué)信息科學(xué)技術(shù)學(xué)院的馮亞娟特任副研究員合作,發(fā)展了一種基于機(jī)器學(xué)習(xí)的分子模擬方法,模擬精度接近DFT計算,計算耗時降低四個數(shù)量級以上且具有線性標(biāo)度;利用該方法研究了經(jīng)典體系三氧化硫復(fù)雜水解反應(yīng)微觀機(jī)制。
該研究團(tuán)隊從2020年開始合作開發(fā)機(jī)器學(xué)習(xí)驅(qū)動的分子模擬方法,基于對稱函數(shù)局域結(jié)構(gòu)特征提取和人工神經(jīng)網(wǎng)絡(luò)的高維勢能面描述方法,開發(fā)了具有自主知識產(chǎn)權(quán)的機(jī)器學(xué)習(xí)分子模擬程序(Nanoscale 2021, 13, 12212; 軟件著作:2021SR0185084)。最近,研究團(tuán)隊將機(jī)器學(xué)習(xí)模型進(jìn)一步擴(kuò)展到應(yīng)用到化學(xué)反應(yīng)過程的高精度模擬,利用對稱函數(shù)提取體系中每個原子的局域結(jié)構(gòu)特征,訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)從局域原子結(jié)構(gòu)向“原子勢能”的映射。這種設(shè)計使模型天然具有“反應(yīng)性”,可描述化學(xué)鍵的形成和斷裂過程。在軟件架構(gòu)上,基于GPU平臺的異構(gòu)計算進(jìn)一步提高了數(shù)值計算效率。為了提高模型訓(xùn)練效率,研究團(tuán)隊發(fā)展了融合了Metadynamics、傘形采樣、分子動力學(xué)采樣和蒙卡采樣的機(jī)器學(xué)習(xí)模型訓(xùn)練數(shù)據(jù)集構(gòu)建方法,實現(xiàn)了復(fù)雜化學(xué)反應(yīng)空間中的高效精準(zhǔn)采樣。以經(jīng)典的三氧化硫水解反應(yīng)體系為例,利用機(jī)器學(xué)習(xí)模型對三氧化硫分子和不同尺寸水團(tuán)簇的水解反應(yīng)體系進(jìn)行了大量反應(yīng)軌跡采樣,系統(tǒng)揭示了三氧化硫分子水解的不同反應(yīng)分支(分別生成中性(H2SO4)(H2O)團(tuán)簇、(HSO4)-(H3O)+離子團(tuán)簇、(SO4)2-[(H3O)+]2離子團(tuán)簇)來源于有限尺寸水團(tuán)簇的表面限域效應(yīng)。
本項研究展示了機(jī)器學(xué)習(xí)驅(qū)動分子模擬方法應(yīng)用于復(fù)雜反應(yīng)體系模擬的潛力,在后續(xù)研究中,將基于該模型建立復(fù)雜動態(tài)體系譜學(xué)模擬方法,實現(xiàn)原位譜學(xué)實驗的“數(shù)字孿生”,應(yīng)用于未來海量同步輻射譜學(xué)數(shù)據(jù)的高通量分析。相關(guān)研究成果以“Surface Confinement of Finite-Size Water Droplets for SO3 Hydrolysis Reaction Revealed by Molecular Dynamics Simulations Based on a Machine Learning Force Field”為題發(fā)表在《美國化學(xué)會志》雜志上。

圖.左:機(jī)器學(xué)習(xí)分子模擬模型原理結(jié)構(gòu);中:三氧化硫-水體系的部分反應(yīng)軌跡;右:大量反應(yīng)軌跡總結(jié)的反應(yīng)分支比