近日,The Plant Journal期刊在線發表了西北農林科技大學農學院旱區作物逆境生物學國家重點實驗室王曉明老師關于中國春小麥熱應激(HS)響應研究的文章。該文章不僅解析了小麥旗葉和灌漿籽粒HS響應的時空動態全長轉錄本,同時比較了兩種組織之間不同的響應HS的基因及可變剪切(AS)調控模式,并探討了小麥三個基因組亞型響應HS的基因表達及功能差異。該結果補充了已發表的小麥參考基因組信息,為研究植物熱適應復雜機制和進化差異提供指導。菲沙基因有幸參與完成了全長轉錄組三+二測序分析以及數據深度挖掘等工作,下面小編就給各位帶來該文章的解讀,以饗看官。
中文題目:全長轉錄組3+2測序揭示面包小麥品系的熱感應和信號傳導機理
發表期刊:The Plant Journal
發表時間:2019 影響因子:5.775
合作單位:西北農林科技大學
測序策略/平臺:PacBio RS II+ Illumina HiSeq
檢索:doi: 10.1111/tpj.14299
研究背景
植物通過重編程基因表達來忍耐各種變化的環境條件,適應并存活下來。小麥(Triticum aestivum L.)是全球重要的農作物,面臨著高溫脅迫的挑戰。但它們的多倍體性質、基因組序列注釋不完全、全面的HS轉錄組缺乏等信息正阻礙著人類對其HS適應過程的充分認識。本研究結合PacBio SMRT測序和Illumina測序,繪制出HS下小麥旗葉和灌漿籽粒的高分辨率的時空動態轉錄組圖譜,生成全面的HS應答全長轉錄本動態列表,補充了最近發表的小麥參考基因組信息,同時提出小麥HS應答的基因轉錄調控和可變剪切調控的差異模式。該研究為深入分析小麥早期HS應答的分子機制提供了全面的資料,突出了多倍體小麥的基因組可塑性和進化差異性。
技術路線
取樣方案:
開花期后第15天,光照4h后溫度升高至37℃,HS下分別于0m、5m、10m、30m、1h、4h收獲籽粒和旗葉(每個時間點3個重復),液液速凍。
測序方案:
① 每個組織分別18個樣本,等量混合后構建4個文庫,文庫大小分別為0.5–1kb, 1–2kb, 2–3kb 和3–6kb,使用PacBio RS II平臺測序。
② 36個樣本同時進行RNA-seq。
主要結果:
① 小麥旗葉和灌漿籽粒在HS早期的動態轉錄組分析
PacBio RS II測序,小麥灌漿籽粒和旗葉分別鑒定得到643,665和508,119條CCS,通過二代數據校正,最終獲得705,335條FLNC,其中91.08%能夠比對到參考基因組IWGSC RefSeq v1.0。705,335條FLNC共注釋得到98,992個非冗余的轉錄本,平均長度(2,410 bp)高于IWGSC RefSeq v1.0注釋的轉錄本(993 bp)(圖1)。鑒定得到的51,160個基因,涵蓋IWGSC RefSeq v1.0中46.18%的高置信度基因。其中45.18%屬多外顯子基因,編碼兩個或兩個以上isoforms(IWGSC RefSeq v1.0中多外顯子基因占比21.87%)(圖1)。以上數據表明,三代+二代測序策略在轉錄本長度和數量上顯著改善了小麥基因組注釋。
圖1小麥旗葉和灌漿籽粒3+2轉錄組測序數據分析
② 新基因和新isoform的鑒定和驗證
基因結構注釋得到4947個(9.67%)新基因,編碼6927個已知isoforms (2774 個單外顯子,4153多外顯子)和63358個新isoforms (圖2)。這些結果表明,3+2測序得到一套高質量的小麥轉錄本,用于小麥HS反應的綜合分析。新基因中有2678個(38.66%)isoforms和1584(2.81%)個已知基因的新isoforms被鑒定為lncRNAs,突出了PacBio測序應用于確定lncRNAs的強大優勢,補充了小麥lncRNA數據庫。
圖2轉錄組數據CIRCOS 可視化展示
③ 熱響應過程的差異表達基因(DEGs)和差異可變剪切水平基因(DSGs)鑒定
旗葉和灌漿籽粒的熱響應模式存在顯著差別。和0m樣本對比,每種組織至少有一個時間點樣本的HS基因表達發生改變,差異表達基因數量在旗葉和灌漿籽粒的占比分別是14.38%和5.01%(旗葉和籽粒中分別是8622和2702個,新基因分別為468和144個)。兩種組織間的差異HS基因數量為3,153個,功能主要表現在“蛋白折疊”、“對刺激的反應”、“蛋白結合”,和“內質網蛋白加工”、“MAPK信號通路”和“剪接體”。葉片和籽粒組織分別鑒定到5684(表達基因的9.48%)和4568個(表達基因的8.48%)可變剪切水平差異基因,其中分別含有281和138個新基因(圖3c)。HS下,DEGs數量急劇增加,DSGs數量保持相對穩定(圖3c),表明AS調控模式與基因轉錄調控模式不同。
11,399個基因共鑒定出98,107個AS事件,包括四種主要類型:外顯子跳躍(ES)、內含子滯留(IR)、剪切供體位點(AD)、剪切受體位點(AA)。其中IR事件HS下被抑制。
圖3 葉片和籽粒中各時間點DEGs和DSGs的鑒定
④ HS可誘導異??焖俚腄EGs和DSGs表達
熱處理后的前30 m內,葉片和籽粒分別檢測到42.83%和74.50%的DEGs, 71.78%和69.31%的DSGs(圖4a,b)。熱處理5m后,葉片和籽粒便檢測到46和80個DEGs,1672和1526個DSGs(圖3 a、c)。表明植物的熱感應和信號傳導比預想的更快。IR事件的調控結果同樣顯示小麥對HS的迅速響應。HS反應標志基因(HSFs和HSPs)的熱誘導快速表達顯示籽粒的熱感應和信號傳導慢于葉片。作為HSFs典型靶點的一些HSPs的AS調控可能在HS早期應答中獨立于HSF。
圖4小麥在HS應答過程中DEGs和DSGs變化迅速
⑤ 不同轉錄因子(TFs)在熱信號傳導中的時間差異
TFs能夠感知應激信號并激活應激反應基因的表達,在環境應激下的基因調控網絡中發揮著主控作用。小麥的IWGSC RefSeq v1.0基因組涵蓋8,908個 TFs,共59個家族,編碼10,356個TF isoforms。本研究發現,HS下,家族基因可產生更多的isoforms,識別到88種新的HSFs isoforms。HSF家族中的DE-TFs顯著富集(圖5a),籽粒熱處理10m時,AP2、FAR1、MYB、bHLH、G3H、NAC等參與熱信號傳導的家族基因和HSF應答基因表達差異一致。HS下, AS調控的TFs隨著時間的推移保持穩定,DSGs的變化規律也是如此(圖5b)。
圖5不同TFs在熱信號傳導中的時間差異
⑥ HS適應中,轉錄水平和AS水平分別調控不同的基因表達和功能途徑
DEGs與DSGs分析顯示葉片的996個基因(11.55%的DEGs和17.52%的DSGs)和籽粒的279個基因(10.32%的DEGs和6.11%的DSGs)之間存在重疊 (圖6a、b)。籽粒中,DEG中14.81%的特異性基因與DSG中4.27%的特異性基因具有基因同源性,葉片中的相對數量則為12.20%和16.26%。說明對HS的應答,轉錄水平和AS水平分別調節不同的靶基因。
AS與轉錄水平的調控差異也在GO和KEGG功能富集中體現?!皟荣|網蛋白加工”和“MAPK信號通路”富集于DEG特異性基因,“抗壞血酸和醛酸代謝”富集于DSG特異性基因。
許多HSF和HSP編碼的基因,如TraesCS5D01G393200(屬于HSFA2亞家族),在HS下顯著上調,AS水平上同樣差異顯著。
⑦ 小麥三個基因組亞型適應HS的應答差異和功能分區
小麥屬異源六倍體物種,包含三個高度相似和冗余的亞基因組。B亞基因組中DEGs和DSGs最多。為了進一步了解亞基因組偏差,本研究鑒定了7287個homologous triplets(亞基因組間同源且每個亞基因組中僅存在一個拷貝的基因)。籽粒和葉片中homologous triplets的DEGs和DSGs比例具有重大差異。DEGs中,存在至少一個時間點,籽粒和葉片的homologous triplets在HS響應中存在差異(圖7c,d);DSGs中,所有籽粒和葉片都存在1-2個homologous triplets被差異剪切,所有homologous triplets的AS都存在差異(圖7c,d)。
圖7 不同基因組亞型在熱信號轉導中的應答差異
籽粒中,涉及內質網蛋白加工的A-同源基因的表達相對于B-和D-同源基因顯著上調。僅在熱處理5m時,D-同源基因發生差異剪切??偟膩碚f,小麥的三個亞基因組在HS響應中展示不同的應答差異和功能分區。
文章亮點
① 結合二代和三代測序技術,提供了迄今為止最全面的熱響應轉錄本,補充了最近發布的小麥參考基因組。
② 綜合分析揭示了小麥響應HS的調控機制,提出小麥熱響應和早期熱信號傳導的調控途徑。
③ 觀察到不同器官和亞基因組之間的應答差異和功能分區,突出小麥多倍體性質在環境適應中的進化差異和優勢。
④ 對植物熱適應機制復雜網絡的解剖,為其他非生物脅迫研究提供指導。
PacBio測序技術超長讀長解決了二代測序技術由于讀長過短引發的一系列問題,例如重復序列的組裝,結構變異的識別等,極大地提升了基因組組裝質量。菲沙基因此次助力合作單位挖掘野豬全長轉錄組新訊息。菲沙基因是國內首家擁有PacBio Sequel三代測序儀的高新技術企業,已與廣大科研學者合作完成各種三代測序分析科研項目累積數百項,擁有成熟的實驗技術、強大的生信分析團隊和豐富的項目經驗,期待與您的合作,助您的科研快速起飛!