Clin Chem |发表PacBio和ONT测序平台对孕妇血浆cfDNA分析性能比较成果

时间:2022-12-11 23:41:14   热度:37.1℃   作者:网络

导读

血浆中的细胞游离DNA (cfDNA) 分析已成为临床应用中非常有价值的一个诊断工具,包括无创产检、癌症等。已有研究表明,Pacific Biosciences公司(PacBio)研发的单分子实时测序系统(Single Molecule Real Time, SMRT)可以检测到孕妇和癌症患者的血浆中存在大量可分析的长链cfDNA。其中,最长的胎儿源性cfDNA和肿瘤源性cfDNA分别为分别为23.6 kb和13.6kb。目前,单分子来源组织分析在单基因疾病的无创产前检测和肝细胞癌 (HCC) 患者的检测中已经显示出潜在的临床应用价值。

除了光信号检测的SMRT测序技术,牛津纳米孔科技(Oxford Nanopore Technologies, ONT)提供了一种通过电信号检测长达50kb长DNA分子的替代方法。在过去的几年中,纳米孔测序技术的快速发展使测序通量和测序精度显著提高。但目前尚不清楚使用PacBio平台检测血浆中长链cfDNA的最新发现是否可以通过ONT的最新技术实现。

近日,香港中文大学卢煜明教授团队在Clinical Chemistry杂志发表了题为“Comparison of Single Molecule, Real-Time Sequencing and Nanopore Sequencing for Analysis of the Size, End-Motif, and Tissue-of-Origin of Long Cell-Free DNA in Plasma”的文章。研究团队对PacBio和ONT两种长读长测序种技术进行了系统比较,以评估两者在血浆cfDNA分析中的应用。文章发表在Clinical Chemistry

主要研究内容及结果

该研究第一部分比较了从PacBio和ONT测序中获得的DNA大小分布,使用不同大小的超声处理人类和小鼠基因组DNA人工混合物。将来自2个平台的长DNA片段和短DNA片段进行比较(图 1)。在第二部分中,使用PacBio和ONT测序分析了来自不同妊娠期的女性、乙型肝炎病毒(HBV)携带者和HCC患者的血浆cfDNA样本。比较了两个平台的测序结果,包括大小和片段末端图谱,以及基于cfDNA单分子甲基化模式的组织来源分析(图 1)。

图1.研究设计,来源:Clinical Chemistry

1.PacBio和ONT测序中的DNA片段大小偏好

使用超声处理的人和小鼠DNA人工混合物评估PacBio和ONT测序中的DNA片段大小偏好,结果显示,PacBio和ONT检测的长短DNA片段比例分别约为5:1和2:1,表明两个平台都显示出对长DNA片段测序的偏好,PacBio显示出比ONT更强的偏好。

2.PacBio和ONT技术检测血浆DNA谱

研究人员利用PacBio和ONT测序平台对31个母体血浆cfDNA样本进行了测序。两个平台获得的cfDNA片段均长于500bp,PacBio测序得到的cfDNA片段比ONT测序更长。例如,对于妊娠晚期的孕妇血浆样本,PacBio测得大于500bp、1kb和3kb的cfDNA片段比例分别为39.3%、23.5%和2.78%;ONT平台对应的比例分别为4.42%、0.74%和0.10%。当针对来自HBV携带者和HCC患者的血浆样本用PacBio和ONT测序时,观察到的结果相似。

研究团队每三个月收集一次孕妇血浆样本,以更高的分辨率对cfDNA进行片段大小谱分析,发现ONT数据中单核体和双核体峰更高,400bp以上的寡核体峰更低。此外,在PacBio数据中明显的短cfDNA(10bp)周期峰特征在ONT数据中不那么突出。PacBio和ONT测序得到的最长cfDNA片段分别为42139bp和60423bp。PacBio测序获得的大于500bp的cfDNA片段百分率显著高于ONT测序。

图2. 孕妇血浆cfDNA片段大小的比较,来源:Clinical Chemistry

对于胎儿和母亲特异性cfDNA的大小谱,数据显示来自PacBio测序的胎儿和母亲特异性长cfDNA比例均高于ONT测序。PacBio和ONT获得的携带胎儿特异性等位基因最长的cfDNA片段分别为23635bp和13989bp。

图3. 胎儿和母体特异性cfDNA片段大小的比较,来源:Clinical Chemistry

3.PacBio和ONT的血浆DNA片段末端图谱

为了比较来自PacBio和ONT的cfDNA 5 '端核苷酸谱,研究人员将来自早中晚孕期的血浆样本cfDNA片段汇集在一起。对于小于500bp的cfDNA片段,PacBio和ONT数据中C端片段最为丰富,PacBio中其次是G端、T端和A端片段(图4A ) 和ONT中的G端、A端和T端片段。从500bp以后,PacBio和ONT数据中C端和T端百分比逐渐下降,A端片段明显上升,而G端片段则逐渐上升。

对基于256个4-mer 5 '端基序的频率进行分层聚类时,源自PacBio和ONT的数据形成了不同的簇。比较PacBio和ONT的4-mer末端基序发现,PacBio和ONT的末端基序排序之间存在很强的正相关关系。

图4. 孕妇血浆中cfDNA的片段端谱,来源:Clinical Chemistry

3.利用血浆DNA单分子进行组织源分析

为了评估使用基于甲基化模式的单分子数据进行组织起源分析的性能,研究团队使用了SNP分析中识别出的491个胎儿特异性片段和13888个母亲特异性片段,结果发现两平台的AUC分别为0.86(ONT)和0.88(PacBio)。

接下来,研究团队进一步比较了PacBio和ONT用于分析cfDNA组织来源的性能,使用的血浆样本来自HBV携带者和肝细胞癌患者。来自PacBio和ONT两平台的每个样本中,符合组织来源分析条件的cfDNA片段中位数为1136和4221。总的来说,使用ONT单分子数据分析得出,HBV携带者和HCC患者的肝源性cfDNA百分比与PacBio数据的测定结果呈正相关。对于每个样本,还计算了HCC甲基化评分用于区分患有和没有HCC的患者,发现HCC患者的HCC甲基化评分明显高于HBV携带者。

图5. 利用血浆DNA单分子进行组织源分析,来源:Clinical Chemistry

结语

研究团队比较了PacBio和ONT用于分析血浆中长链cfDNA的性能。其中一个发现是,PacBio测序的血浆cfDNA比ONT测序平台得到的更长,PacBio中大于1kb的cfDNA片段比例是ONT的30倍左右。cfDNA片段图谱中,cfDNA短片段有10 bp的周期性峰,这在PacBio的数据中很明显,但在未来研究中,还是很有必要使用非测序为基础的方法进一步验证血浆中长片段cfDNA的存在。

使用PacBio和ONT的数据进行基于单分子甲基化模式的cfDNA组织来源的分析性能表现类似。虽然PacBio生成的数据中长cfDNA的百分比更高,但每个样本中符合组织起源分析条件的cfDNA片段数量比ONT仅高2-4倍。但当使用ONT数据进行cfDNA片段大小和末端基序分析时,需要执行额外的测序数据处理步骤,包括两端接头序列的识别和修剪,以确保准确确定片段大小和末端。

研究团队希望这些初步的系统比较结果可以为新兴的长链DNA诊断领域中选择测序平台提供参考。同时,未来对于长读长测序平台的更多层面、更深度的综合分析同样很有必要。

上一篇: 精准狙击你的脂肪!打一针,即可有效减重,...

下一篇: 重磅!第十五届“谈家桢生命科学奖”揭晓,...


 本站广告