二次無機(jī)氣溶膠是大氣細(xì)顆粒物(PM2.5)的重要組分,其快速生成與積累往往是冬季重污染天氣出現(xiàn)的關(guān)鍵因素。傳統(tǒng)的空氣質(zhì)量數(shù)值模式由于輸入數(shù)據(jù)的不確定性和模式內(nèi)部物理化學(xué)機(jī)制模擬方案的不完善,導(dǎo)致二次無機(jī)氣溶膠模擬仍然具有較大的不確定性。
針對(duì)這一難題,地球系統(tǒng)數(shù)值模擬裝置(以下簡(jiǎn)稱“寰”)核心團(tuán)隊(duì)中國(guó)科學(xué)院大氣物理研究所唐曉正高級(jí)工程師及團(tuán)隊(duì)構(gòu)建了一個(gè)基于層疊泛化算法(Stacked Generalization)的機(jī)器學(xué)習(xí)集成模型,實(shí)現(xiàn)多個(gè)機(jī)器學(xué)習(xí)模型(RF、LGBM)的集成。利用氣象模擬、污染物模擬、排放源清單、地形、二次無機(jī)氣溶膠地面觀測(cè)數(shù)據(jù)進(jìn)行模型訓(xùn)練,實(shí)現(xiàn)了對(duì)嵌套網(wǎng)格空氣質(zhì)量預(yù)報(bào)模式(NAQPMS)模擬的2020年1~3月京津冀二次無機(jī)氣溶膠模擬濃度場(chǎng)的訂正。試驗(yàn)結(jié)果表明機(jī)器學(xué)習(xí)集成模型能有效提高京津冀二次無機(jī)氣溶膠模擬精度,其不僅能改進(jìn)觀測(cè)所在站點(diǎn)的模擬,也能改進(jìn)空間分布模擬,使得模擬濃度的均方根誤差下降30%以上。集成模型相較于單一的機(jī)器學(xué)習(xí)模型在綜合統(tǒng)計(jì)指標(biāo)上表現(xiàn)更優(yōu),特別是在污染程度重的區(qū)域。該研究為改進(jìn)二次無機(jī)氣溶膠模擬提供了一種新的方法,揭示了機(jī)器學(xué)習(xí)模型在觀測(cè)數(shù)據(jù)稀缺時(shí)改進(jìn)氣溶膠模擬的潛力。
該論文第一作者為中國(guó)科學(xué)院大氣物理研究所碩士生丁寧,通訊作者為唐曉正高級(jí)工程師。該成果近期在線發(fā)表于Atmospheric Environment期刊,研究得到了國(guó)家自然科學(xué)基金(Grant No. 42175132)、國(guó)家重點(diǎn)研發(fā)計(jì)劃(Grant No. 2022YFC370270)、中國(guó)科學(xué)院網(wǎng)絡(luò)安全和信息化專項(xiàng)(Grant No. CAS-WX2021SF-0107-02)和國(guó)家重大科技基礎(chǔ)設(shè)施“地球系統(tǒng)數(shù)值模擬裝置”(EarthLab)的共同資助和支持。

圖1機(jī)器學(xué)習(xí)集成模型的流程示意圖

圖2 機(jī)器學(xué)習(xí)集成模型與空氣質(zhì)量數(shù)值模式(NAQPMS)、單機(jī)器學(xué)習(xí)模型(RF、LGBM)精度評(píng)估的泰勒?qǐng)D
論文信息:
Ding, N., Tang, X., Wu, H., Kong, L., Dao, X., Wang, Z., Zhu, J., 2024. Development of an integrated machine learning model to improve the secondary inorganic aerosol simulation over the Beijing–Tianjin–Hebei region. Atmospheric Environment, 327, 120483. https://doi.org/10.1016/j.atmosenv.2024.120483.