近日,面向高能同步輻射光源(HEPS)海量衍散射圖像降噪、實驗數(shù)據(jù)在線解析的迫切研究需求,中科院高能所HEPS光束線軟件系統(tǒng)張一團隊與趙麗娜AI研究團隊密切合作,取得對應(yīng)的AI for Science研究階段性進展,研究成果在領(lǐng)域重要學(xué)術(shù)期刊《IUCrJ》與《npj Computational Materials》上在線發(fā)表。
X射線衍散射技術(shù)朝著高通量多維度進階,使其成為同步輻射領(lǐng)域數(shù)據(jù)挑戰(zhàn)最大的方法學(xué)之一。研究人員聚焦其傳統(tǒng)物理解析方法復(fù)雜性高、時效性差的科學(xué)問題,利用全連接神經(jīng)網(wǎng)絡(luò),高效準(zhǔn)確地提取了二維衍射圖像中隱藏的三維纖維取向分布信息(圖1)。該方法以衍散射數(shù)據(jù)解析為切入點,建立了同步輻射機器學(xué)習(xí)在線數(shù)據(jù)解析的統(tǒng)一流程框架,并實現(xiàn)解析效率的萬倍提速,為未來海量數(shù)據(jù)的在線處理奠定底層基礎(chǔ)。該工作日前在國際晶體學(xué)TOP期刊《IUCrJ》在線發(fā)表(趙麗娜研究員、張一副研究員為通訊作者,博士生孫明輝、博士后董政為共同第一作者),中科院高能所是本工作的唯一通訊單位。
在高通量多維度海量數(shù)據(jù)的快速解析研究中,充分意識到高效數(shù)據(jù)采集、樣品輻射損傷降噪的方法學(xué)研究重要性。因此,基于卷積神經(jīng)網(wǎng)絡(luò),研究人員構(gòu)建了一套專用于衍射與散射圖像降噪的深度學(xué)習(xí)網(wǎng)絡(luò)SEDCNN (Small Encoder-Decoder Convolutional Neural Networks),實現(xiàn)了低曝光時間衍射與散射圖像的降噪(圖2)?;谘芯咳藛T提出的方位角積分計算的降噪指標(biāo),該模型成功做到了訓(xùn)練速度與降噪結(jié)果穩(wěn)定性遠(yuǎn)超現(xiàn)有SOTA模型。該工作日前在《npj Computational Materials》在線發(fā)表(董宇輝研究員為通訊作者,博士生周中正、博士后李純?yōu)楣餐谝蛔髡撸锌圃焊吣芩潜疚奈ㄒ煌ㄓ崋挝弧?
上述研究工作是在中科院高能所先后部署的“基于虛擬束線的自動化與智能化同步輻射實驗數(shù)據(jù)采集軟件研究(E25455U210,負(fù)責(zé)人:張一)”與“物理嵌入機器學(xué)習(xí)驅(qū)動高能同步輻射物質(zhì)解析新發(fā)現(xiàn)(E35457U210,負(fù)責(zé)人:趙麗娜)”科技創(chuàng)新項目支持下開展完成,已初步形成人工智能在HEPS實驗過程控制與數(shù)據(jù)采集、海量數(shù)據(jù)分析與信息挖掘應(yīng)用研究的新模式。未來,在董宇輝研究員發(fā)表于Nature Reviews Physics期刊的“大型科學(xué)軟件框架 + AI for Science”先進科研理念指導(dǎo)下,HEPS光束線軟件系統(tǒng)還將聯(lián)合計算與網(wǎng)絡(luò)通訊系統(tǒng),進一步加強與線站科學(xué)家、人工智能領(lǐng)域?qū)<业目蒲泻献?,共同解決HEPS的科學(xué)大數(shù)據(jù)挑戰(zhàn),推動科學(xué)大發(fā)現(xiàn)。
圖1: 機器學(xué)習(xí)用于海量衍射圖像高效分析
圖2: SEDCNN網(wǎng)絡(luò)架構(gòu)與降噪效果
(中科院高能所 供稿)