自晚更新世開始,人類開啟了對野生動物的馴化,最終形成了包括禽畜和寵物在內(nèi)的家養(yǎng)動物。在馴化后的歷史中,一些家養(yǎng)動物的野生祖先滅絕了(如原牛),一些則繼續(xù)生活在野外(如野豬),成為與家養(yǎng)動物的野生祖先遺傳關(guān)切的野生近緣種(物種/亞種)。今天,野生近緣種不僅是理解動物馴化歷史的重要參考,更是極為重要的生物資源。野生近緣種保留了畜禽在人工培育中丟失的寶貴遺傳多樣性,如抗病性、耐粗飼、適應(yīng)惡劣環(huán)境的能力。這些特性,是未來應(yīng)對氣候變化和新型疫病的關(guān)鍵基因資源。當商業(yè)品種因近親繁殖而退化時,科學家可以從野生近緣種中尋找優(yōu)異基因,通過雜交改良,讓畜禽更強壯、更健康。然而,這些珍貴的野生近緣種正因棲息地破壞和與家畜雜交而面臨威脅,也為相關(guān)資源的評估、保護與管理帶來了諸多挑戰(zhàn)。
中國西南野生生物種質(zhì)資源庫動物種質(zhì)庫研究團隊長期開展家養(yǎng)動物野生近緣種遺傳資源多樣性研究工作。前期的系列研究工作表明紅原雞(Gallus gallus)是現(xiàn)代家雞的直系野生祖先,二者遺傳背景高度相似,且在馴化后持續(xù)發(fā)生基因交流,導致家雞遺傳成分不斷滲入野生種群,遺傳邊界愈加模糊。這使得鑒定家雞與紅原雞成為家養(yǎng)動物-野生近緣種雜交體系中最具代表性、也最具挑戰(zhàn)性的案例之一。鑒于傳統(tǒng)形態(tài)學與分子遺傳學鑒定方法均難以有效區(qū)分,中國科學院昆明動物研究所聯(lián)合泰國農(nóng)業(yè)大學(Kasetsart University)等國內(nèi)外研究團隊,創(chuàng)新開發(fā)了一套用于區(qū)分野生近緣種與家養(yǎng)動物以及雜交個體的人工智能(深度學習)分析流程(圖1)。在紅原雞與家雞體系中,研究團隊整合了1,960個樣本(含164份紅原雞和1,796份家雞)基因組數(shù)據(jù),構(gòu)建了基于285個SNP的識別模型,實現(xiàn)對紅原雞、家雞以及雜交個體的高效準確識別(圖2)。在針對博物館保存的歷史標本基因組數(shù)據(jù)的測試中,即便存在基因型缺失,該模型識別準確率仍達97.8%,體現(xiàn)了在低通量測序甚至古代DNA測序數(shù)據(jù)分析中保持了良好的魯棒性。研究團隊將該流程拓展至野豬與家豬雜交體系,表現(xiàn)出較強的通用性與推廣價值。

圖1.基于人工智能的野生近緣種鑒定流程示意圖
這一工作展示了人工智能與保護基因組學的融合應(yīng)用,為家養(yǎng)動物野生近緣種的評估與保護研究提供了新的技術(shù)范式,有助于推動遺傳資源的管理與利用。傳統(tǒng)的群體基因組學分析,依賴于構(gòu)建大量群體基因組變異參考面板(reference panel),面對少量樣本數(shù)據(jù)加入,涉及頻繁的數(shù)據(jù)合并以及祖源比例重新估算等存儲和計算問題。本研究提出的人工智能策略憑借“訓練一次、多次部署、持續(xù)迭代”的優(yōu)勢,能有效應(yīng)對上述挑戰(zhàn),更適用于日常保護遺傳學和遺傳資源管理工作。整個分析流程與訓練模型均可開放獲取https://github.com/icefire080/Deep_SNP_screen_and_RJF_identification

圖2.?基于285個SNP信息的人工智能模型鑒定紅原雞、家雞和雜交雞
研究成果以“Harnessing deep learning in searching wild relatives of domestic animals”為題,發(fā)表在分子生態(tài)學國際刊物Molecular Ecology Resources上。云南大學和中國科學院昆明動物所聯(lián)合培養(yǎng)博士研究生蔡正飛(已畢業(yè)),中國科學院昆明動物研究所劉貝助理工程師(已離職)、尹婷婷高級工程師為論文共同第一作者;泰國農(nóng)業(yè)大學Kornsorn Srikulnath教授,中國科學院昆明動物研究所張亞平研究員、彭旻晟研究員為共同通訊作者。該研究得到來自國家重點研發(fā)計劃、云南遺傳資源保護與基因挖掘國際聯(lián)合實驗室、中國科技基礎(chǔ)資源調(diào)查專項、國家自然科學基金、泰國科學研究與創(chuàng)新署等的資助,并獲得了中國西南野生生物種質(zhì)資源庫動物種質(zhì)資源庫(國家重大科技基礎(chǔ)設(shè)施專項)的支持。
文章鏈接:https://doi.org/10.1111/1755-0998.70133