PacBio測序即單分子實時測序,其以SMRT Cell為載體進行測序反應,位于ZMW孔底部的熒光信號檢測區錨定了DNA聚合酶和一條DNA片段,并通過不同熒光標記的核苷酸及熒光激發的過程,將不同堿基的信號捕捉下來,從而得到DNA序列信息。
SMRT cell ZMWs 熒光基團
PacBio Sequel IIe
與傳統的二代測序技術相比,三代PacBio測序技術具有超長讀長、無需擴增、無GC偏好性、可以直接檢測堿基修飾等優點,在科研與醫學相關領域得到廣泛應用。PacBio最新推出的Sequel II(Sequel IIe)測序平臺共有兩種測序模式,即CLR測序和HiFi測序。
1.1 CLR測序
CLR測序模式稱為超長測序模式,其插入片段長度在30Kb以上,產生的數據是基于單循環測序的結果,一個插入片段只測序一次,準確率和PacBio 常規測序保持一致,在85%左右。CLR測序可以利用自身的數據進行糾錯,當數據深度達到 50X 左右時,一致性序列準確性超過99.999%(QV50)。
CLR 測序示意圖
通過構建40Kb文庫,菲沙PacBio Sequel II平臺CLR測序最高產出達到220Gb,平均150Gb;Subreads 平均讀長20Kb,N50平均超過29Kb,具體見下表。
CLR下機數據統計表
1.2 HiFi測序
PacBio HiFi Reads是準確度超過Q20(>99%),并且還能兼顧超過10kb,甚至可達20 kb的長讀長測序模式。在HiFi測序模式下,酶讀長與CLR測序模式相當甚至更長(超過100 Kb),但插入片段只有10-20 Kb,因此測序時酶會繞著DNA模板(插入片段)進行滾環測序,即插入片段會被多次測序。這樣單次測序中造成的隨機測序錯誤,可以通過算法進行自我糾錯校正,最終得到高準確度的HiFi Reads。
HiFi測序示意圖
通過構建15-20Kb的文庫,菲沙PacBio Sequel II平臺HiFi測序CCS原始數據超過500Gb,平均產出380Gb;HiFi最高產出38Gb,平均接近19Gb;HiFi平均讀長15Kb,N50接近17Kb,具體見下表。
HiFi下機數據統計表