青霉菌廣泛分布于陸地和海洋等各種自然環境中,其中草酸青霉可分泌大量的碳水化合物活性酶(CAZymes)來消化植物生物量,并產生具有多種生物活性的次級代謝物,包括抗菌和抗腫瘤化合物,在生物煉制、生物修復和制藥行業有極大的應用潛力。從中國亞熱帶森林土壤中分離得到的草酸青霉菌株HP7-1能產生高活性的纖維素酶,可用于預處理過的甘蔗渣,將木質纖維素轉化為葡萄糖,再發酵生產燃料乙醇,因此具有良好的工業應用潛力。然而,目前已測序的六株草酸青霉菌株(114-2、HP7-1、SYJ-1、JU-A10-T、TY02和SGAir0226)的基因組序列均不足以達到分析染色質三維結構的要求,難以研究染色質的空間結構在細胞功能和基因表達調控中起著何種重要作用。
近日,廣西大學趙帥研究組聯合菲沙基因解析了絲狀真菌草酸青霉菌株HP7-1的三維基因組圖譜,研究成果以“Three-Dimensional Genome Map of the Filamentous FungusPenicillium oxalicum”為題發表在微生物學知名期刊Microbiology Spectrum(IF:7.171),該研究采用PacBio測序技術和Hi-C技術,構建了草酸青霉菌株HP7-1的高質量染色體水平基因組序列,并分析了染色質三維結構,檢測到1099個TAD/globule結構(2kb~76kb),在globule邊界富集出了轉錄因子motif。在1kb高分辨率下檢測到12203個順式互作和7884個反式互作,分析了纖維素酶和木聚糖酶基因以及轉錄因子編碼基因的空間互作。菲沙基因承擔了該研究中的Hi-C建庫、測序和部分分析工作。
材料方法
研究材料:草酸青霉菌株HP7-1
研究方法:Pacbio測序、Hi-C技術
研究結果
1.草酸青霉基因組
該研究采用Pacbio測序技術和Hi-C技術組裝得到高質量、大小為30.79Mb的草酸青霉基因組。contig N50達3.81Mb,scaffold N50為4.07Mb,拼接成的8條染色體大小為1.80~5.87Mb,BUSCO評估其完整性為98.60%,注釋得到9728個蛋白編碼基因,鑒定到了85個新的蛋白質。在9728個蛋白質中,有712個CAZymes、496個轉錄因子和47個與次級代謝相關的蛋白簇。除此以外,還注釋得到45個rRNA和201個tRNA。
圖1.草酸青霉基因組特征
2.草酸青霉三維基因組
基于Hi-C互作數據觀察1kb、2kb、10kb和20kb分辨率下的草酸青霉三維基因組結構。除了明顯的染色體內的互作頻率高于染色體之間的互作,草酸青霉中無論是在所有8條染色體內還是在染色體之間,著絲粒周圍(包含著絲粒)和亞端粒區域(包含端粒)之間存在顯著高頻互作,表明草酸青霉的三維染色質結構屬于I型具有類似Rabl構象的著絲粒聚類特征。
在1kb分辨率下鑒定出12203個順式和7884個反式顯著互作,它們之中分別含有5738個和1324個基因。順式互作基因的30.7%參與代謝,其次是遺傳信息處理(8.5%)和細胞過程(6.6%),而反式互作基因的33.3%參與代謝。另外,反式互作的基因更加明顯的參與了核苷酸和能量代謝,順式互作的基因則更偏向于異種生物的生物降解和代謝。
圖2.草酸青霉的全基因組空間互作圖譜
哺乳動物和植物中的“TAD”結構,在一些真菌中被稱為“globule”結構,大小在50kb到100kb之間。在2kb分辨率下,同樣基于insulation score方法,在草酸青霉中檢測到了1099個globule(2~76kb)。其邊界和內部分別有1282和9476個基因,其中1051個基因同時位于globule邊界和內部,主要參與代謝(32.06%),其次是遺傳信息處理(9.9%)和細胞過程(6.7%)。
對草酸青霉的基因組結構進行3D建模,得到一個類似“燈泡”的染色體構象,所有的著絲粒都聚集在一端,而端粒幾乎聚集在另一端。
圖3.草酸青霉基因組的3D結構模型
3.草酸青霉中纖維素酶和木聚糖酶基因,以及轉錄因子編碼基因的空間互作
在草酸青霉基因組注釋結果中,有25個纖維素酶和10個endo-β-1,4-木聚糖酶(XYN)基因,不均勻地分布在八條染色體上。主要的纖維二糖水解酶基因位于四號染色體上。除了七個基因,大部分纖維素酶和XYN基因分布在不同的globule。在所有纖維素酶和木聚糖酶基因中,15個具有順式互作,6個具有順式和反式互作,與這些基因發生順式互作的DNA片段是每個基因的鄰近上游和下游側翼區域,例如啟動子區和終止子區。β-葡萄糖苷酶基因POX_g08536與多個片段存在反式互作,這些反式相互作用可能是由于著絲粒和端粒的整體基因組接近造成的,也可能是對特定碳源Avicel的誘導反應或通過接近和誘導的共同作用所致。結合在Avicel碳源下草酸青霉的主要纖維素酶和木聚糖酶基因共表達但DNA低頻互作的現象,作者猜測纖維素酶和木聚糖酶的生物合成有條件且被特異性控制,而轉錄因子(TF)介導的轉錄過程則可能與此相關。
在該研究中,496個TF分布在430個globule內,其中77個TF基因的部分DNA序列在globule邊界。346和79個TF基因分別發生有順式和反式互作,64個TF基因同時發生這兩種互作。對于調控纖維素酶和木聚糖酶基因表達的關鍵轉錄因子的編碼基因,會在非優選碳源(包括Avicel)時有不同程度的轉錄,并且其中幾乎所有基因都與相鄰的上、下側翼區域存在順式相互作用。與纖維素酶和木聚糖酶基因的相互作用相比,涉及TF的編碼基因的相互作用并不頻繁。
圖4.草酸青霉中纖維素酶和木聚糖酶基因,以及轉錄因子編碼基因的空間互作
4.globule邊界的轉錄因子motif富集
本研究利用JASPAR數據庫中的真菌TF-binding profile,選擇MEME Suite對草酸青霉菌株HP7-1的globule邊界區域進行motif掃描,共檢測到163個候選motif?;趃lobule邊界的TF motif分析,前三個顯著富集的是POX_c04470、POX_c04124和POX_b02187蛋白。NCBI BLASTP鑒定出它們是AZF1、SPT23和SFL1的同源蛋白,將其重命名為PoxAZF1、PoxSPT23和PoxSFL1。MEME Suite掃描顯示,PoxAZF1 TF結合在多個纖維素酶基因啟動子區(1.5 kb上游),PoxSPT23和PoxSFL1 TF則是結合到主要纖維素酶和木聚糖酶基因的啟動子。
圖5.PoxAZF1、PoxSFL1和PoxSPT23 TF在纖維素酶和木聚糖酶基因啟動子區的motif富集
總 結
該研究首次解析出了絲狀真菌草酸青霉的染色體水平基因組及其三維結構,發現著絲粒之間和端粒之間均存在高頻相互作用,檢測到1099個globule結構,其邊界富集有許多結合轉錄因子的motif,如PoxAZF1、PoxSPT23和PoxSFL1。構建了草酸青霉3D基因組模型,繪制了纖維素酶和木聚糖酶基因及轉錄因子編碼基因的空間互作。該研究為真菌染色質相互作用提供了全局視角,并為研究絲狀真菌中基因表達的空間調控提供了重要資源。
廣西大學趙帥副研究員為本文的通訊作者,廣西大學李成喜博士為本文第一作者,菲沙基因劉琳博士署名參與了本研究。該研究得到了國家自然科學基金、廣西重點研發計劃項目的專項經費以及2019年廣西千名中青年骨干教師培訓計劃的支持。
參考文獻:
Li CX, Liu L, et al. Three-Dimensional Genome Map of the Filamentous Fungus Penicillium oxalicum. Microbiology Spectrum, American Society for Microbiology, 0(0): e02121-21.