您好,歡迎光臨武漢菲沙基因信息有限公司
027-87224696 | marketing@frasergen.com | 中文|English 咨詢客服
MARKET DYNAMICS—— 市場動態 ——
首頁 > 市場與支持 > 市場動態
市場動態MARKET DYNAMICS

NAT BIOTECHNOL丨一文教你如何做單細胞轉錄組多樣本整合分析

發布時間:2021-5-10 16:29:19閱讀次數: 分享到:

自單細胞測序技術出現以后,各種單細胞的分析軟件及方法也應運而生。由于技術的高速發展,并且在個性化藥物治療設計等方面開始越來越多的應用,現階段出現了很多單細胞的測序平臺和分析方法。而面對各種各樣的算法,如何選擇合適的分析方法對數據進行分析使其發揮最大價值仍是當前面臨的一個重大挑戰。


近日,美國洛馬林達大學基因組學中心的王昌宏教授(Charles Wang)和美國食品藥品管理局(FDA)的肖文明博士共同作為通訊作者在Nature Biotechnology發表了題為“A multicenter study benchmarking single-cell RNA sequencing technologies using reference samples”的研究性文章,該項研究重點研究了不同生物信息處理方法對數據的影響,評估了不同中心的不同測序平臺上的單細胞測序性能。這是一項綜合性研究,涉及不同技術平臺、不同樣品和生物信息學方法(包括預處理、歸一化和批次效應校正),為平臺優化和軟件的選擇提供了實踐指導,也為分析流程的開發提供了重要資源。


該研究使用了四種scRNA-seq平臺:包括10x Genomics,Fluidigm C1, Fluidigm C1 HT和Takara Bio ICELL8;測序工作分別在四個研究中心進行:洛馬林達(LLU),美國國立癌癥研究所(NCI), 美國食品藥品監督管理局(FDA)和美國Takara Bio(TBU)。對于樣本的選擇,研究人員選擇了兩個特征明顯的參考細胞系:來自同一供者的乳腺癌細胞系(樣本A,HCC1395)和正常B淋巴細胞系(樣本B, HCC1395BL)。然后使用3 '或全長單細胞轉錄組測序方法對單細胞進行了測序,建立了20套標準單細胞轉錄組數據。

對于生成的20個數據集,研究人員對不同的數據預處理方法、數據歸一化方法、批次效應校正方法等進行了評估。研究人員比較了六種單細胞數據預處理方法(10×: Cell Ranger, UMI-tools, zUMIs; C1&ICELL8: featureCounts, RSEM, kallisto),評估了八種不同的歸一化方法(sctransform, scran deconvolution, counts per million (CPM), logCPM, trimmed mean of M values (TMM), DESeq, quantile, Linnorm)和七種不同的批次校正算法(Seurat3, fastMNN, Scanorama, batch-balanced k-nearest neighbors (BBKNN), Harmony, limma, ComBat )??傮w研究設計如下圖:


主要結果

1

數據預處理方法的比較

對基于UMI(Unique Molecular Identifier)的scRNA-seq數據,研究人員比較了三種預處理方法:Cell Ranger(10x Genomics)、UMI-tools和zUMIs。結果顯示,三種方法在鑒定細胞數量和每個細胞檢測到的基因數量層面均存在差異。對非基于UMI的scRNA-seq數據,他們比較了另外三種預處理方法:featureCounts、RSEM和kallisto。這些數據預處理流程包括修剪、比對和基因計數。結果表明,三個不同的預處理方法檢測到的基因數量的差異比較大。kallisto在全長轉錄本scRNA-seq數據集中發現了每個細胞中更多的基因。


2

歸一化方法的比較

研究人員使用Sihouette指標評估歸一化算法的效果和聚類結果。TMM和quantile未能使樣本A和樣本B歸一化,其Sihouette得分與對照的原始數據相似,TMM和quantitle結果最差,因此不建議使用;而Sctreansform 流程處理后的數據方差最小。


3

不同批次效應校正方法的比較

研究人員通過四種不同的數據集組合來評估這些算法的性能,方案1包含所有單細胞轉錄組數據集,包括混合和純合數據集,用以評估算法的clusterability(分離不同細胞類型的能力,即不同的細胞類型是否能夠很好的區分開);方案2包含了乳腺癌細胞系數據(樣品A),用以評估算法的mixability(對相似細胞類型進行分組的能力,即不同批次的相同細胞類型是否能夠聚類到一塊);方案3包含B細胞系來源數據,評估軟件的mixability;方案4中,將5%或10%的乳腺癌細胞(樣本A)加入到B淋巴細胞(樣本B)中,用10x Genomics平臺橫跨兩個中心測序得到,用以評估算法的clusterability。


方案1的結果顯示,在消除批次效應和兩種細胞類型分離方面,BBKNN(在聚集性方面排名最高)、fastMNN和Harmony最有效;方案2和方案3的結果顯示,Seurat3是將不同批次的相似細胞聚集在一起的最佳方法之一。而當僅分析來自10x平臺的數據時,Scanorama都能清楚地分離了不同的細胞,并且將相似的細胞分組在一起。


研究表明,盡管數據預處理對單細胞基因檢測和細胞分類有一定的影響,但批次效應的處理才是迄今為止正確分類細胞的最關鍵步驟。另外,通過混合兩種細胞系,該研究還評估了樣本及數據的組成和性質對生物信息學方法分析結果的影響。

研究人員對這些預處理方法和算法進行了綜合排序,如下圖所示,基于10×的數據可以用文中所列的任何方法進行預處理,而kallisto則更適用于全長轉錄組測序數據的預處理。 


下圖為本研究中提出的scRNA-seq分析的最佳實踐建議。僅分析10×數據時,Scanorama的效果就很好。Seurat版本3適用于生物學上相似的樣品,但如果在不同批次中存在很大比例的不同細胞類型,則批次效應過度校正,且細胞類型分類錯誤。


綜上,該研究比較分析了6種預處理流程、8種歸一化方法和7種批次校正算法,結果表明,單細胞轉錄組數據之間確實有批次效應。同時,該研究強調了測序技術平臺和分析數據算法的重要性,也為科研人員選擇最適合解決科學問題的技術平臺和生物信息方法提供了實踐指導。

參考文獻:

Chen, W., Zhao, Y., Chen, X. et al. A multicenter study benchmarking single-cell RNA sequencing technologies using reference samples. Nat Biotechnol (2020).

原文鏈接:https://www.nature.com/articles/s41587-020-00748-9

農學科研
表觀遺傳
基因組
重測序
轉錄調控
微生物
生物信息學服務
醫學臨檢
實體瘤基因檢測
血液腫瘤基因檢測
心血管精準用藥基因檢測
單基因遺傳病檢測
病原微生物產品
醫學科研
三代測序技術
單細胞測序技術
二代測序技術
三維基因組學技術
市場與支持
市場動態
菲沙課堂
產品速遞
關于菲沙
菲沙簡介
菲沙團隊
菲沙成果
技術平臺
合作伙伴
聯系我們
加入我們
校園招聘
社會招聘
聯系我們
  • 電話:027-87224696
  • 傳真:027-87224785
  • Email:support@frasergen.com
  • 地址:中國湖北省武漢市東湖高新技術開發區高新大道666號光谷生物城D3-1棟三樓
微信公眾號
Copyright ? 2018武漢菲沙基因信息有限公司 鄂ICP備13010493號-1. All Rights Reserved Designed by Wanhu

国产色精品vr一区二区_九色内射国产_欧美97色伦欧美一区二区日韩_国产91精品国语高清自产拍