相信大家對金剛狼和死侍這兩位漫威超級英雄并不陌生,他們都具有超強的自愈能力(當然,死侍的自愈能力明顯更強,因為死侍的頭被砍掉后也還能再生出來,但是金剛狼辦不到)。雖然這是電影中的人物,但在現實世界中也存在類似的具有組織再生能力的生物。比如真渦蟲、蠑螈、壁虎等,它們在斷頭斷肢斷尾后依然能重新長出來,只是時間長短不同而已(我們人類很是羨慕這種超能力哇)。
那么,為什么這些動物會具有組織再生的能力呢?為什么我們人類沒有這種能力呢?
實際上,任何一個組織消失后都能夠再生的這種“超能力”在很多動物中都存在,人們通過相關的一些轉錄組和功能研究已經鑒定出了較多的損傷應答關鍵靶基因,但是并不清楚這些基因是如何被聯系起來的。已有研究發現斑馬魚的心臟和鰭以及果蠅的成蟲器在再生過程中都涉及到組織再生增強子元件被激活,但是全身再生過程的表觀調控應答機制還不清楚。
近期,來自麻省理工學院的Gehrke研究組以具有超強組織再生能力的無腸目動物(acoel)三帶豹蠕蟲(Hofstenia miamia)為研究對象,發現了大量調控全身再生基因開啟的開關,系統構建了調控組織再生過程的基因表達調控網絡。這一重要研究成果以題為“Acoel genome reveals the regulatory landscape of whole-body regeneration”發表在3月15日的Science雜志上。
全身組織再生的過程伴隨著一系列基因轉錄水平的變化,而轉錄水平受到染色質開放狀態的調控,這種組織再生過程的轉錄調控機制還未被闡明。研究者以三帶豹蠕蟲為研究對象,首先構建了其參考基因組序列,然后采用ATAC-seq技術揭示了上千個與再生應答相關的染色質開放區,并鑒定出動態的轉錄因子motifs結合位點。在組織再生過程中,發現早期生長應答(early growth response, EGR)因子結合位點最具有可變開放性的特點。通過RNAi抑制EGR位點的染色質打開,結果發現Egr可以作為一種先鋒因子(pioneer factor)直接調控早期損傷誘導基因的表達開啟。通過這些研究可以構建出全身組織再生過程的基因表達調控網絡,也促進了物種間的組織再生過程的比較基因組學研究。
主要結果
○ 三帶豹蠕蟲的基因組組裝及注釋
材料:
單只蟲子、多只蟲子的混合、再生過程不同時間點的胚胎蟲體
測序平臺及文庫:
Illumina 300bp、500bp PE文庫,3kb、7kb MP文庫組裝,Nanopore糾錯,Chicago scaffolding。轉錄組文庫。
組裝注釋結果:
組裝基因組大小950Mb(11.85% gaps),contigN50為15.8kb,scaffold N50為1.04Mb,雜合度0.426%,重復序列56%,基因數量22,632個,84% complete BUSCO genes。
(PS:小編不評論這個組裝效果,只是納悶為什么不用三代組裝呢)
○ 組織再生過程中染色質開放狀態的變化
材料:
將蟲體從中部截肢后,在0h、3h、6h、12h、24h、48h共6個時間點分別取靠近頭部和靠近尾部的損傷面,每個樣品各2個生物學重復。
技術方法:ATAC-seq+RNA-seq(就是菲沙基因的明星產品之一哦)
分析結果:
在尾部再生過程中,一共鑒定出約18000個差異的開放區域,大部分位于內含子和基因間區
6h時的peaks最多,隨后新打開的peaks逐漸減少,到24h~48h時逐漸關閉。
接下來重點尋找再生過程中的關鍵motif及轉錄因子,通過掃描全基因組中差異開放區的motif,發現一些motif在靠近頭部的樣品中變化較大,另一些motif在靠近尾部的樣品中變化較大,還有一些motif在靠近頭部和尾部的樣品中均變化較大,其中,一種叫做早期生長應答(early growth response, EGR)因子的結合位點具有最高的可變開放性特點。EGR motif在0h時處于關閉狀態,在3h時處于開放狀態,直到48h時仍處于開放狀態,提示Egr蛋白在再生過程中非常重要,并且EGR在其它可再生動物中的同源基因也被報道發揮重要作用。
○ 功能驗證Egr是調控再生過程的主要轉錄因子
三帶豹蠕蟲基因組中僅含有單拷貝的EGR基因,通過RNA原位雜交實驗發現EGR基因在截肢后1h的損傷面中表達上調,且在不同細胞類型包括表皮、肌肉、神經、成體未分化細胞、干細胞中均表達上調,說明再生過程的活躍進行。此外,利用RNAi抑制EGR的表達,發現蟲體不能夠再生出胚芽,不能重新長出頭部和尾部。
不同時間點的RNA-seq數據表明,有61個基因在至少1個時間點的頭部和尾部損傷面中均表達上調,選擇了其中20個基因設計RNA探針進行原位雜交驗證,證實13個基因確實是表達上調的。
那接下來的問題是,EGR基因與這13個基因之間的表達調控關系是怎樣的呢?
研究者推測Egr是處于最上游的調控因子,為了驗證推測,在6h時用RNAi抑制EGR表達后,發現這13個基因中有12個基因均出現顯著的表達下調,并使用RNA原位雜交驗證了其中4個基因的表達下調,表明Egr確實是位于調控再生過程上游的主要轉錄因子。
○ Egr直接調控其它損傷應答轉錄因子的表達
現在我們觀察到在6h時用RNAi抑制EGR表達后,有12個關鍵基因的表達發生下調,那么它們為什么會下調表達呢?是否受到Egr的直接調控?
為了研究這種調控關系,研究者再次采用ATAC-seq技術,在6h時用RNAi抑制EGR表達后進行ATAC-seq,發現含有Egr蛋白結合位點的12個基因中,有10個基因的上游開放區均變得明顯減弱,包括EGR本身的開放狀態也趨向于被關閉。這10個基因包括編碼2個轉錄因子(runt, deaf1),一些信號通路中的因子(follistatin, nrg-1, nrg-2, nlk),有多種功能的細胞質蛋白(p-protein, ankrd, mtss-1)和1個未知的蛋白(wound induced expression-1, wie-1)。這些結果表明Egr蛋白可以直接結合至自身和其它損傷應答基因的調控區來開啟基因的表達。
○ Egr作為先鋒轉錄因子按層級調控再生基因表達
通過分析染色質開放狀態變化大小并進行功能驗證,研究者最終提出了再生基因的層級調控網絡模型egr–runt–nrg-1,即Egr蛋白通過自身結合到其它轉錄因子基因結合區開啟其表達,包括結合到RUNT基因的啟動子區開啟RUNT的表達,然后Runt蛋白再結合到NRG-1基因的啟動子區開啟NRG-1的表達。這么看來,Egr好比一個能開啟再生功能的開關,一旦被打開,就可以激發其它再生過程。
Egr基因家族成員在多個物種的損傷再生過程中均發揮著重要作用,這些物種包括一些脊椎動物、真渦蟲、海星等,作為調控再生過程的主要轉錄因子,其在真渦蟲中的作用通過ATAC-seq也得到了證明,然而有些物種,比如我們人類,即使存在EGR基因,但并不能實現組織再生功能(非常有限),這必定與其再生調控網絡的差異有關,即信號傳遞關系與三帶豹蠕蟲不一樣。
再生相關基因是如何連接在一起的,答案其實來自于基因組的非編碼區和染色質結構狀態。不同物種中進化出的調控方式不一樣,其它物種中的再生調控網絡關系還有待進一步的闡明,對此,本文提供了很好的研究范例!
菲沙基因長期致力于解決三代和三維基因組研究領域的科學問題,通過創新的Hi-C及ATAC-seq技術已完成近百個物種的染色質空間互作及開放狀態分析,為大量科研學者解決了關鍵的基因表達調控機制。在ATAC-seq方面,菲沙基因已完成的物種包括人類的多種細胞系和組織,以及牛、羊、豬、鵝、魚、蠶、鼠、蠅、擬南芥、棉花、水稻..........等等,我們期待能解析更多物種的染色質狀態及非編碼區的調控秘密,非常歡迎大家與我們合作~
參考文獻:
Gehrke AR., et al. Acoel genome reveals the regulatory landscape of whole-body regeneration. 2019, Science.