華命生物目前已成功完成50+物種的T2T基因組組裝,物種涵蓋動(dòng)物、植物、昆蟲及同源和異源多倍體等疑難物種,已有多個(gè)合作項(xiàng)目在頂級(jí)期刊發(fā)表和接收,歡迎有需要的老師垂詢。聯(lián)系方式:18371456025。
棉花(Gossypium L.)在全球紡織和種子油生產(chǎn)中扮演著不可或缺的角色。異源多倍體棉花物種陸地棉(Gossypium hirsutum)一直是廣泛研究和育種工作的對(duì)象。理解陸地棉的異源多倍體基因組對(duì)于揭示關(guān)鍵農(nóng)藝性狀的基礎(chǔ)至關(guān)重要。
3月17日,中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所馬雄風(fēng)研究員團(tuán)隊(duì)在著名期刊《Nature Genetics》上發(fā)表了題為“A telomere-to-telomere genome assembly of cotton provides insights into centromere evolution and short-season adaptation”的研究論文,作者組裝了陸地棉栽培品種中棉113(ZM113)的端粒到端粒(T2T)基因組,解析了所有26個(gè)著絲粒和以前未組裝的區(qū)域,深入研究了染色體D08著絲粒重新定位和染色體D03上與早熟性相關(guān)的近端著絲粒倒位的單倍型。
一、陸地棉ZM113 T2T基因組構(gòu)建
作者使用150.7× ONT ultra-long、26.5× PacBio HiFi、48.5× NGS以及110.4× Hi-C數(shù)據(jù),通過多步組裝和校正,最終得到了包含26條完整染色體的T2T基因組(ZM113 CRI_v1.0)。
T2T基因組共注釋了78,471個(gè)蛋白質(zhì)編碼基因。5S rDNA兩個(gè)主要的串聯(lián)重復(fù)位點(diǎn)位于A09和D09,而45S rDNA共注釋了403個(gè)18S和438個(gè)28S亞基。
圖1:陸地棉栽培種ZM113 T2T基因組組裝
表1:ZM113與其他陸地棉組裝質(zhì)量比較
二、陸地棉著絲粒的完整組裝和轉(zhuǎn)座子特征
通過CENH3 ChIP-seq實(shí)驗(yàn),確定了ZM113 CRI_v1.0的功能性著絲粒。所有26條染色體上獨(dú)特的ChIP-seq峰證實(shí)了著絲粒區(qū)域均完整組裝。
基于重復(fù)序列比對(duì)的著絲粒預(yù)測(cè),有25個(gè)著絲粒預(yù)測(cè)結(jié)果與CENH3 ChIP-seq實(shí)驗(yàn)結(jié)果一致,但D08染色體是例外。
棉花著絲粒主要由逆轉(zhuǎn)錄轉(zhuǎn)座子而非衛(wèi)星重復(fù)序列組成。在ZM113中,除了D08染色體外,重復(fù)元件占著絲粒區(qū)域的95%,主要包含Gypsy和未知的LTR-RTs,插入時(shí)間(INS)分析顯示,著絲粒中的LTR-RTs比非著絲粒區(qū)域更年輕。
主成分分析顯示,A和D亞基因組的CEN-TE明顯聚類。A和D特異性CEN-TE的全長(zhǎng)LTR(flLTR)數(shù)量較少,表明其轉(zhuǎn)座活動(dòng)更為近期,且與亞基因組起源無(wú)關(guān)。對(duì)代表性CEN-TE的系統(tǒng)發(fā)育分析顯示,A和D基因組CEN-TE序列的系統(tǒng)發(fā)育模式在很大程度上交織在一起,表明它們具有共同的祖先。
圖2:ZM113著絲粒區(qū)域鑒定
三、D08著絲粒的重定位和動(dòng)態(tài)演化
CENH3定位識(shí)別出D08染色體的著絲粒(D08CEN),該區(qū)域TE含量、LTR插入時(shí)間、GC含量以及甲基化模式均與其他著絲粒不同。另外作者發(fā)現(xiàn)在附近區(qū)域有個(gè)假D08著絲粒(Ψ-D08CEN)與其他染色體上的著絲粒結(jié)構(gòu)相似。表明D08CEN可能是一個(gè)新形成的著絲粒,伴隨著早期著絲粒(即Ψ-D08CEN)的退化而演化。
D08CEN包含83.9%串聯(lián)排列的GhSat194,表現(xiàn)出較低的CENH3結(jié)合水平。另有一個(gè)GhSat194 HOR位于一個(gè)4 Mb倒位(D08_INV)側(cè)翼,作者接下來(lái)檢查了七個(gè)棉花多倍體物種的CENH3結(jié)合和GhSat194分布,與陸地棉相比,CENH3定位將其他六個(gè)多倍體棉花的著絲粒區(qū)域定位到Ψ-D08CEN區(qū)域,支持D08CEN代表了陸地棉特有的一個(gè)新形成的著絲粒。GhSat194在D基因組二倍體祖先雷蒙德氏棉(G. raimondii)中存在于D08染色體上,但在陸地棉中含量出現(xiàn)顯著擴(kuò)增,所以推測(cè)GhSat194的這種擴(kuò)增與D08CEN的形成同時(shí)發(fā)生,從而在陸地棉中生成了這一不同尋常的著絲粒。
圖3:D08著絲粒的動(dòng)態(tài)演化
四、結(jié)構(gòu)變異和D03調(diào)控開花時(shí)間主效位點(diǎn)
作者進(jìn)一步比較了ZM113與之前發(fā)布的九個(gè)陸地棉基因組,發(fā)現(xiàn)了大量的SVs,將這些SV組裝成一個(gè)非冗余的35,746個(gè)缺失和21,265個(gè)插入的集合,共有251個(gè)缺失(coreDELs)在其他基因組中被檢測(cè)到,代表了ZM113特有的區(qū)域,總長(zhǎng)度為591,002 bp,在這個(gè)特有的coreDEL區(qū)域中發(fā)現(xiàn)了28個(gè)基因。
基于ZM113參考基因組對(duì)419個(gè)陸地棉種質(zhì)進(jìn)行的GWAS分析,在D03染色體上識(shí)別出一個(gè)顯著的FD位點(diǎn),定位在11.95–33.87 Mb的區(qū)間內(nèi)。進(jìn)一步對(duì)雜交F2群體進(jìn)行BSA-seq,結(jié)果也確認(rèn)該區(qū)段是全基因組范圍內(nèi)與早熟性最顯著相關(guān)的區(qū)域。單倍型分型和SNP聚類分析顯示該區(qū)域單倍型Hap-D03-1與顯著早花相關(guān),該區(qū)域與一個(gè)大的近中心倒位(D03_INV)重合,該倒位僅存在ZM113等部分品種中。
基于這些發(fā)現(xiàn),作者提出了早花Hap-D03-1演化的兩步模型。首先,D03_INV在早期馴化過程中出現(xiàn),并在陸地棉基因庫(kù)中被固定。隨后,在這一倒位背景下,出現(xiàn)了賦予早花特性的特定單倍型,從而產(chǎn)生了如ZM113這樣的早熟品種。這種倒位背景可能通過抑制重組解釋了該區(qū)域觀察到的強(qiáng)LD,促進(jìn)了多個(gè)連鎖QTL的積累,從而產(chǎn)生了大規(guī)模的關(guān)聯(lián)信號(hào)。
圖4:陸地棉基因組結(jié)構(gòu)變異
圖5:鑒定D03染色體上FD相關(guān)的倒位衍生單倍型
結(jié)語(yǔ)
本研究通過構(gòu)建高質(zhì)量的T2T基因組,揭示了陸地棉栽培品種ZM113的基因組特征,特別是其早熟性和纖維品質(zhì)的遺傳基礎(chǔ)。研究還發(fā)現(xiàn)了D08染色體上的著絲粒重新定位現(xiàn)象,并提出了D03染色體上早熟單倍型的進(jìn)化模型。這些發(fā)現(xiàn)為棉花育種提供了重要的基因組資源和新見解。
參考文獻(xiàn)
Hu, G., Wang, Z., Tian, Z. et al. A telomere-to-telomere genome assembly of cotton provides insights into centromere evolution and short-season adaptation. Nat Genet(2025). https://doi.org/10.1038/s41588-025-02130-4
華命生物產(chǎn)品服務(wù)一覽