植物是陸地生態(tài)系統結構、功能和進化的基礎,為人類提供了食物、藥物和住所等不可或缺的資源。被子植物(即有花植物)占據陸地植物種類的90%,其起源和早期快速演化問題被達爾文稱為“惱人之謎(abominable mystery)”,也成為植物學、進化生物學和古生物學家持續(xù)關注的熱點問題。近30余年來,科學家們嘗試利用DNA序列重建了被子植物的生命之樹,極大地改變了我們對被子植物進化歷史(系統發(fā)育)的認識。前期由于測序成本及技術的限制,被子植物系統發(fā)育研究僅依賴于少量基因,且通常來自質體(負責光合作用的細胞器)基因組。目前基于公共數據庫也可以下載到大量的質體基因數據,支撐著包括分類學在內的生物學研究。然而,質體基因大多為母系遺傳,通常只講述了故事的一面。
近年來,隨著高通量測序技術的快速發(fā)展,英國皇家植物園邱園植物和菌物生命之樹(the Plant and Fungal Trees of Life,PAFTOL)研究團隊設計了適用于被子植物尺度的353個核基因探針(Angiosperms353,Johnson et al.,2019. Systematic Biology)。在此基礎上,該團隊牽頭組織的國際合作團隊利用被子植物353個核基因探針捕獲的數據,構建了迄今取樣最完整的基于核基因數據的被子植物“生命之樹”。該研究涵蓋了被子植物全部64目和416科,包含7923個屬,屬級水平取樣達58%,為前期研究的15倍,同時利用200個化石校正點推算了被子植物的起源及早期演化歷史。該研究是繼1993年英國皇家植物園邱園團隊基于質體rbcL基因序列重建被子植物系統發(fā)育關系(Chase et al.,1993,Ann MO Bot Gard)、千種植物轉錄組計劃(Leebens-Mack et al.,2019. Nature)、昆明植物所種質庫團隊基于質體基因組數據解析被子植物的起源與早期演化(PPA)(Li et al.,2019. Nature Plants)并構建被子植物科級水平迄今最完整取樣的“生命之樹”(PPA II)(Li et al.,2021. BMC Biology)之后的又一里程碑式的研究成果,揭示了被子植物的進化歷史及其占據地球陸地生態(tài)系統主要生態(tài)位的過程,主要成果如下:
1.解碼館藏標本DNA數據的前沿研究
該研究共獲取了被子植物9506個代表種的樣本,其中超過3400種的材料來自48個國家163個標本館,其中大約800個種的DNA數據為首次獲得。根據世界自然保護聯盟的紅色名錄(IUCN),已測序的物種中有511個已瀕臨滅絕。此外,該研究可以有效利用低質量的DNA,成功地對1829年(迄今已195年)在尼泊爾采集的球花福祿草(Arenaria globiflora)標本進行測序并獲得有效DNA序列。這些來自館藏標本的數據對于探討被子植物演化歷史的關鍵節(jié)點至關重要。
2.邁向揭開達爾文“惱人之謎”的關鍵一步
盡管核基因組和質體基因組的生物學特性(如大小、拷貝數、遺傳方式、重組和進化速度等)存在差異,但該研究結果在很大程度上進一步印證了前期主要基于質體的被子植物系統發(fā)育框架APG IV(圖1,2),支持目前接受的64個目中有58個和416個科中的406個為單系,并指出菊分支和薔薇分支內的核質沖突較為明顯。在科級水平上,85%的科之間系統發(fā)育框架與昆明植物研究所種質庫團隊(Li et al.,2021. BMC Biology)基于質體基因組的被子植物系統發(fā)育樹2.0(PPA II)推斷的關系一致?;诤嘶颢@得的生命之樹與基于質體基因研究結果的比較加深了研究人員對特定分支進化的理解,但由于古雜交或全基因組復制等生物事件,基因之間相互沖突的系統發(fā)育信號使得系統樹的一些分支關系仍無法解決。
在獲得被子植物穩(wěn)定拓撲結構的基礎上,研究人員利用200個化石標定點,推算了該類群的起源及演化歷史,發(fā)現被子植物經歷了兩次主要的多樣化事件,第一次是在中生代起源(約1.4-2.7億年前)后不久,此時超過80%的目已經存在,第二次是在新生代(大約4000萬年前)并與全球氣溫下降的時間相吻合。該研究強調物種的多樣化與基因樹之間的沖突也有著密切的關系,揭示被子植物主要支系經歷了錯綜復雜的演化歷史,為揭開達爾文“惱人之謎”邁出關鍵一步。
3.呼吁各國科學家合作并充分利用開放數據
正如人們可以根據元素周期表來預測元素的性質一樣,物種在生命之樹上的位置能讓科學家更方便快捷的預測其相關屬性,新的數據對于許多科學領域將有很大的潛在利用價值。例如生命之樹及相關數據將有助于新物種的界定進而推動植物分類的發(fā)展,可以預測可能含有藥用潛力的植物并發(fā)現新的先導化合物,同時對保護植物多樣性和應對全球氣候變化具有重要意義?;诖?,該項研究呼吁加強國際合作,并將免費釋放相關的數據,期盼這些數據能夠得到各國科學家的充分利用。
該研究以Phylogenomics and the rise of the angiosperms為題發(fā)表在國際頂級學術期刊Nature。全球共27個國家138個研究機構或大學的279位研究人員參與了該項工作,包括來自中國科學院昆明植物研究所、華南植物園,中國醫(yī)學科學院、成都中醫(yī)藥大學和西南林業(yè)大學的團隊。其中,昆明植物研究所種質庫李德銖研究團隊參與了部分研究材料的獲取、實驗以及文章修改成文等工作。

圖1 基于核基因數據獲得的被子植物生命之樹(左)與基于質體基因序列獲得的被子植物生命之樹APG IV(右)在目級水平上的對比圖。

圖2 基于353個核基因的被子植物系統發(fā)育樹