近日,華中科技大學栗茂騰教授團隊在Plant Communications(IF:10.5)在線發表了題為 “3D genome structural variations play important roles in regulating seed oil content in Brassica napus”的研究成果,為從基因組三維結構角度理解SOC的分子調控機制提供了新的視角。首先,作者利用Hi-C、ATAC-seq和RNA-seq多組學技術,比較了高油材料N53-2(含油量超過50%)和低油材料Ken-C8(含油量約40%)中基因組三維結構、染色質開放性和基因表達的差異,并發現N53-2和Ken-C8之間存在大量DARs和DEGs,這些DARs和DEGs傾向于富集在SOC相關QTL/AGRs區域中,并且SOC相關基因的表達水平與QTL/AGRs區域中的基因組結構變異密切相關。其次,作者通過構建N53-2和Ken-C8雜交產生的KN-DH群體并進行精細定位,鑒定出了A09染色體QTL/AGRs區域中存在結構變異的候選基因BnaA09g48250D,該基因被注釋為乙酰輔酶A羧化酶2(CAC2),是脂肪酸合成過程中的關鍵酶。最后,作者通過基因功能驗證實驗,表明BnaA09g48250D的過表達和敲除分別導致轉基因株系的SOC顯著增加(4.90% ~ 9.46%)和減少(3.03% ~ 6.75%)
圖1 文章信息
研究思路
研究結果
1、N53-2和Ken-C8的基因組三維結構和基因組結構變異
為了探索甘藍型油菜種子基因組三維結構與油分含量(SOC)之間的關系,該研究對高油材料N53-2(含油量超過50%)和低油材料Ken-C8(含油量40%左右)的種子進行Hi-C實驗,利用Juicer軟件分析了染色質相互作用,并重構了3D基因組結構。首先,該研究發現N53-2中有159675個染色體內相互作用和1787062個染色體間相互作用(圖2A),而Ken-C8中有163267個染色體內相互作用和1765908個染色體間相互作用(圖2B)。其次,該研究發現N53-2和Ken-C8的3D基因組結構存在局部結構差異。例如,N53-2中端粒(藍色點)主要分布在外圍區域,而Ken-C8中端粒浸沒在內部區域(圖2C-1F),這表明Ken-C8中3D基因組結構比N53-2中更緊湊。
圖2 N53-2和Ken-C8的相互作用分析和3D基因組結構
此外,該研究發現無論是在N53-2還是在Ken-C8中,A02和C02染色體之間有最高的相互作用頻率,A亞基因組內部的相互作用頻率遠大于C亞基因組內部和A與C亞基因組之間的,A與C亞基因組之間的同源區域的相互作用頻率顯著高于非同源區域的。同時,A亞基因組的整體基因表達水平高于C亞基因組。A與C亞基因組之間都有很高的同源性。另外,在多條染色體上存在很多可能形成KNOT結構和KEEs(KNOT-engaged elements,異染色質區域內一些遠距離互作網絡形成的結構)的強染色質相互作用。這些結果表明,油菜種子基因組三維結構具有復雜的特征和差異,可能與SOC有關。
圖3 N53-2 A亞基因組和C亞基因組的共線性分析
為了進一步分析N53-2和Ken-C8中染色質的功能狀態,該研究結合前期得到的數量性狀位點/關聯區域(QTL/AGRs),對compartment和TADs的特征進一步探索,首先,N53-2和Ken-C8分別有556個和648個compartment,以及909和907個TADs。其次,QTL/AGRs中A compartment的比例比全基因組中的高,而B compartment并非如此。此外,A compartment的基因密度比B compartment的高。這些結果表明,QTL/AGRs區域中的染色質比其他基因組區域更活躍。同時,在TAD結構中,N53-2中的KEEs信號比Ken-C8中的強,表明N53-2中的染色質更容易形成KNOT結構(圖4 E-F的藍色箭頭)。對TAD邊界區域進行的motif分析顯示,MYB46和WRKY28轉錄因子(TF)可能在油菜基因組邊界區域發揮重要的調控作用。
圖4 Compartment和TAD分析
2、QTL/AGRs區域的染色質開放性和基因表達
該研究對高油材料N53-2和低油材料Ken-C8進行ATAC-seq和RNA-seq實驗,識別了差異開放性區域(DARs)和差異表達基因(DEGs)。首先,該研究發現N53-2和Ken-C8之間存在121345個DARs,其中N53-2相對于Ken-C8有63722個開放性增強的區域和57623個開放性降低的區域。其次,N53-2相對于Ken-C8有7473個上調基因和6247個下調基因。這些差異表達基因與SOC相關的KEGG通路有關,如“亞油酸代謝”、“甘油磷脂代謝”、“脂肪酸生物合成”和“脂肪酸代謝”。此外,該研究結合前期SOC相關的QTL/AGRs數據進行比較分析。結果顯示,N53-2和Ken-C8之間的DARs和DEGs富集在QTL/AGRs主要分布的染色體上(圖5)。同時,進一步分析DARs在QTL/AGRs區域內外的分布和密度,發現DARs傾向于QTL/AGRs區域內。與此類似,N53-2和Ken-C8之間的DEGs,尤其是上調DEGs也傾向于QTL/AGRs區域內。這些結果表明,在N53-2和Ken-C8中,QTL/AGRs區域中的染色質開放性和基因表達與SOC有關。
圖5 N53-2和Ken-C8的DARs、DEGs和QTL/AGRs
3、基因組結構變異影響QTL/AGRs區域的基因表達
該研究對N53-2和Ken-C8進行多組學整合分析。研究發現,一些QTL/AGRs區域在N53-2和Ken-C8之間存在顯著的結構變異(圖6)。其次,該研究分析了位于QTL/AGRs區域內DARs相關聯基因表達水平,并發現N53-2中開放性增強DARs相關聯基因的整體表達水平也顯著更高。由于DARs反映了N53-2和Ken-C8之間染色質開放性的差異,因此基因組結構變異可能與QTL/AGRs區域內基因表達水平有關。
圖6 N53-2和Ken-C8中chrC08(左)和chrA09(右)的多組學分析(Hi-C、ATAC-seq、RNA-seq、QTL/AGR、重測序和染色質相互作用)
此外,一些重要的DEGs(包括轉錄因子和參與脂肪酸生物合成和三酰甘油形成的基因)主要分布在QTL/AGRs富集區域,并且在N53-2中相對于Ken-C8上調。該研究還探索了轉錄因子與參與脂肪酸合成通路的基因之間的相互作用,共鑒定出50個相互作用位點,并發現N53-2和Ken-C8之間存在相互作用模式的差異。例如N53-2中LEC2、FUS3和ABI3與chrA10上的BnaA10g01090D(GPAT2)發生相互作用。已有研究表明,ABI3通過參與植物油合成的相互作用網絡來激活油積累。然而,在SOC低的Ken-C8中,這種相互作用被打斷了。
4、chrA09 QTL/ARGs區域的精細定位和候選基因的功能驗證
該研究通過多組學分析,發現了一個位于A09染色體32Mb到34Mb區間的重要含油量QTL cqOC-A9-9,該區域在N53-2和Ken-C8兩個親本之間有顯著的基因組結構差異。該研究在篩選帶有該QTL位點DH株系的基礎上,通過和低油親本Ken-C8多次回交構建了包含2820個單株的BC4F1 NILs(近等基因系)群體,并根據Ken-C8和N53-2的重測序結果開發Indels分子標記,對cqOC-A9-9進行了精細定位,將其分為兩個區域cqOC-A9-9-1和cqOC-A9-9-2,其中,cqOC-A9-9-2覆蓋了一個300Kb的區域,包含了62個注釋基因,被選為進一步研究的對象。
圖7 cqOC-A9-9的精細定位
根據轉錄組分析,該研究發現cqOC-A9-9-2內有19個DEGs,其中BnaA09g48250D編碼異源乙酰輔酶A羧化酶(htACCase)的生物素羧化酶亞基,是唯一一個與油脂合成相關的基因。該研究通過克隆測序分析發現BnaA09g48250D編碼區沒有差異,但Ken-C8中其啟動子區有一個6313bp的插入,并且該區域在Ken-C8的染色質相互作用相對較少。隨后通過過表達和CRISPR/Cas9敲除的方法,證實了這個基因對SOC的調控作用:過表達BnaA09g48250D的轉基因株系比野生型顯著增加SOC,而敲除BnaA09g48250D的轉基因株系比野生型有顯著降低SOC。
圖8 Ken-C8和N53-2中BnaA09g48250D的序列分析(上)及其與相鄰區域相互作用的信號(下)
最后,該研究通過KN DH群體在不同環境和年份下的SOC數據,以及一個包含chrA09上與SOC QTL熱點共定位的DAR的近等基因系,證實了BnaA09g48250D是chrA09上影響SOC的候選基因,而且其啟動子區域的結構變異在不同群體中對SOC有穩定的影響。
小 結
該研究通過Hi-C揭示了甘藍型油菜基因組3D結構特征,并結合ATAC-seq、RNA-seq、QTL/AGRs等方法探討了基因組結構變異在甘藍型油菜SOC調控中的作用。該研究證實了BnaA09g48250D基因是chrA09上影響SOC的候選基因,而且其啟動子區域的結構變異在不同群體中對SOC有穩定的影響,這為油菜種子油分含量調控網絡及其遺傳改良策略提供了新的線索和依據。
華中科技大學生命科學與技術學院的栗茂騰教授為本研究的通訊作者,張禮斌副教授、李懷鑫博士生及武漢菲沙基因信息有限公司的劉琳博士為共同第一作者,何堅杰和閆書祥博士生、朝紅波、尹永泰和趙衛國博士也參與了此項研究。該研究得到國家重點研發計劃項目“油菜和花生重要基因資源挖掘與利用”(2022YFD1200402)和國家自然科學基金面上項目(32272067 和32072098)的資助。