首個藏族人群高質量參考基因組發布1.jpg       圖為ZF1基因組的質量評估以及結構變異解析。中國科學院昆明動物研究所供圖

       記者從中國科學院昆明動物研究所獲悉,該所宿兵課題組、西藏大學歐珠羅布教授與崔超英教授課題組、上海營養與健康研究所徐書華教授課題組、青海省高原醫學科學研究院吳天一教授課題組等,經過兩年多聯合攻關發布首個藏族人群高質量參考基因組,并利用該基因組系統解析了藏族人群全基因組水平的結構變異元件數據集。該成果于近日在線發表在《國家科學評論》雜志上。

       世居高原的藏族人群對極端低氧環境的適應是人類適應性進化的典型例子,一直以來受到廣泛關注。以往對于藏族高原適應的遺傳分析主要集中在基于二代短讀長測序數據的單核苷酸變異位點(Single Nucleotide Variants,SNVs)的研究,且發現了兩個與藏族高原適應相關的關鍵基因EPAS1和EGLN1,解釋了藏族人群較低血紅蛋白濃度這一適應表型。然而,除了血紅蛋白濃度,藏族其他的高原適應特征(比如較高的通氣量、較低的肺動脈壓等)還不能被SNVs解釋。

       眾所周知,基因組上的大尺度結構變異(Structural Variants,SVs)可能影響染色質空間結構及基因的表達調控,與疾病和進化表型也可能相關,但藏族人群基因組中的SVs對高原適應是否有貢獻僅有EPAS1基因下游一個大片段缺失的一例報道,缺乏對全基因組水平SVs的系統研究。

       為了系統解析藏族人群全基因組SVs,研究人員利用三代長讀長測序技術以及多種輔助組裝技術,從頭組裝了一個高質量的藏族人參考基因組(珠峰1號,ZF1)。該基因組是第一個利用長片段序列從頭組裝的藏族人群的高質量參考基因組,相比于目前已有的人類參考基因組,具有更好的序列連續性和完整性。

利用該基因組,研究人員找到了17,900個ZF1中發生的SVs,其中6,505個是ZF1有別于其他兩個東亞人(HX1和AK1)的SVs。功能富集分析發現,這些ZF1特有的SVs相關       基因的功能顯著富集在一個重要的低氧通路——GTPase活性調控通路上。通過進一步的群體分析,研究人員發現了一個發生在MKL1基因內含子上的163bp缺失,這個缺失在藏族和漢族群體中表現出顯著的頻率差異,且該缺失與藏族較低的肺動脈壓顯著相關。

       另外,研究人員系統評估了藏族基因組中與古人類(尼安德特人和丹尼索瓦人)共享的基因片段,發現ZF1相比于其他東亞個體的基因組有更高的共享片段比例(1.32%-1.53%)。其中一個典型的例子是發生在SCUBE2基因內含子上一個662bp的插入,分析發現該插入在藏族中富集并與藏族的肺功能顯著相關。

       這一研究成果,將為今后藏族高原適應的醫學和進化研究提供重要的基礎數據資源。