关注新生,预见未来 | 探究全球新生儿测序计划之——全面应用rWGS的BeginNGS项目
时间:2023-08-11 19:36:32 热度:37.1℃ 作者:网络
全世界每年约完成1.4亿例新生儿筛查(Newborn Screening, NBS)[1]。作为出生缺陷三级预防措施之一,NBS的重要意义在于早期筛查、早期诊断干预。虽然NBS已实施多年,并极大地改善了新生儿的健康状况,但筛查的遗传疾病数量显然没有跟上基因组学或治疗方法创新的步伐。为此,已有多个国际新生儿测序项目启动,期望通过先进的基因测序技术为新生儿筛查带来新的突破,帮助临床医生更全面、更高效、更精准地发现新生儿潜在疾病风险。
01 新生儿测序集结号,多方共建诊疗一体化平台
2022年6月16日,由美国Rady儿童基因组医学研究所(RCIGM)总裁兼首席执行官Stephen Kingsmore博士牵头,在Alexion Pharmaceuticals、Travere Therapeutics、Inozyme Pharma、Fabric Genomics、Genomenon、Illumina和TileDB等公司的支持下启动了一项新生儿基因测序项目——BeginNGS,旨在为新生儿筛查、疾病管理和干预以及罕见病药物开发实施全基因组测序提供一个平台,供全球合作者使用。BeginNGS团队首先进行了一项针对约400种疾病的小型试点研究,并计划在美国和希腊的多个地区招募约2,000名婴儿,开展疾病相关的基因组筛查研究[2
据了解,BeginNGS将使用RCIGM团队的快速全基因组测序(rWGS)技术来筛查遗传病,并确定无症状儿童的潜在治疗方案,对现有的新生儿筛查流程和基础设施进行补充。同时,BeginNGS也将使用GTRx(Genome-to-Treatment)工具为医生提供治疗指南。其中,rWGS流程的关键部分来自Illumina,包括利用Nextera DNA Flex文库制备,NovaSeq6000测序平台等进行全基因组测序。GTRx为Kingsmore团队与Illumina、Alexion Pharmaceuticals、RPRD诊断实验室等机构合作开发的在线数据库(https://gtrx.rbsapp.net/about.html),整合了包括来自OMIM、PubMed 和DrugBank 等10 个大型遗传资源的数据,可以为筛查阳性的新生儿管理和治疗提供自动化指导[3]。
图1.BeginNGS,来源:参考资料[1]
近年来,国际数据共享和测序技术的不断发展极大地加速了新的、超罕见疾病的识别。在过去的十年中,rWGS已发展成为遗传性疾病的有效诊断检测,并在新生儿遗传病诊断中获得认可。BeginNGS项目启动一年多以来,研究团队已将rWGS方法尝试应用于NBS(NBS-rWGS),产生可用的基因组数据库、适配于NBS-rWGS的机器学习、智能化诊断等方面取得了重要成果。
02 临床效用初显锋芒,WGS助力新生儿遗传病诊断
2022年8月24日,Stephen Kingsmore团队在AJHG发表了题为“A genome sequencing system for universal newborn screening, diagnosis, and precision medicine for severe genetic diseases”的研究文章,证明了NBS-rWGS可应用于多种儿童遗传病诊断,并帮助改善早期治疗的可行性[4]。研究采用英国生物样本库(UKBB)中454,707个测序数据模拟进行了NBS-rWGS,选择了388种具有有效治疗方法的遗传病,在疑似危重证患儿(2,208名)及其父母(2,168名)中,rWGS做出119项诊断。NBS-rWGS确认了104项(87%)和15项既往未报告的发现,NBS-rWGS阴性预测值为99.6%,灵敏度为88.8%(如图2)。此外,研究团队评估了NBS-rWGS的临床效用,在41名新生儿病例中,如果在出生第5天进行基于NBS-rWGS的干预,7名婴儿的症状可以完全避免,21名婴儿避免大部分症状,13名婴儿避免部分症状。
图2.研究概要,用于新生儿筛查、诊断和严重遗传病精准医疗的基因组测序系统。来源:参考资料[4]
但该研究未对NBS-rWGS进行成本效益研究。除此之外,基因组数据库也限制着rWGS在新生儿遗传性疾病诊断中的应用。鉴于基因组科学和精准医疗的快速发展,NBS-rWGS需要更多的途径来保持基因组数据库的更新,通过结合筛查、诊断、大基因组数据库和学习反馈循环,获得更高的分析性能和更短的诊断时间。
03 临床普及性探索,高质量DNA文库制备保障WGS数据可靠
2023年2月14日,Stephen Kingsmore团队与美国加利福尼亚大学圣地亚哥分校的Christina Chambers团队合作在npj Genomic Medicine发表了题为“Scalable, high quality, whole genome sequencing from archived, newborn, dried blood spots”的研究文章,证明了高质量的rWGS数据可以从存储长达20年的存档干血斑(DBS)中获得[5]。来自世界各个国家和地区的NBS存档DBS可以为儿童遗传病研究提供巨大的基因组数据库资源,为在此类研究中充分利用这一资源,存档DBS必须产生可用于rWGS的高质量基因组DNA(gDNA)。在这项研究中,研究团队使用Illumina PCR free基因组文库制备和KAPA HyperPlus两种方法,均可以从存档DBS中提取到具有足够的质量和数量的gDNA用于rWGS。
如图3所示,随着WGS深度的增加,编码区域OMIM基因覆盖率比例增加。使用存档DBS制备的Illumina文库和使用匹配血液样本制备的KAPA和Illumina文库的WGS结果显示,编码区域OMIM基因覆盖比例分布非常相似。但与存档DBS制备的Illumina文库或血源KAPA或Illumina文库相比,使用存档DBS制备的KAPA文库需要多生成约60GB的WGS数据,才能提供相当的编码区域OMIM基因覆盖率。因此,Illumina方法更一致地产生了足够的疾病基因覆盖率,支持可靠的杂合变异检测,这在WGS的临床应用中是重要的。此外,存档DBS的rWGS结果复现了血液样本rWGS报告的所有SNV、Indel、SV缺失和SV重复,血液和存档DBS的rWGS结果保持92.6%的SNV和Indel一致,表明存档DBS产生的rWGS满足高置信度变异检测的质量控制指标。该研究显示存档DBS是群体基因组研究中rWGS的合适样本类型。
图3.测序深度与完全覆盖基因比例的关系。使用Illumina方法(橙色)或KAPA法(蓝色)制备存档DBS文库的WGS,以及用Illumina方法(灰色)或KAPA方法(黄色)制备匹配血液样本文库的WGS。虚线显示变化趋势。来源:参考资料[5]
据估计,全世界每年有700万婴儿出生时患有遗传病,进入新生儿重症监护室(NICU)通常为他们的诊断和治疗提供了一次重要机会。急性病婴儿的疾病进展迅速,需要及时诊断,rWGS为NICU的快速明确诊断争取了时间,有效减少了不必要的等待、病情恶化和死亡率 。
已有估计表明,NICU收治的新生儿中约有18%患有孟德尔疾病,这一人群中rWGS的诊断率超过35%[6,7]。但目前NICU主要通过人工筛选优先进行rWGS诊断的患者,这是一个非常耗时的过程,且缺乏足够训练有素的专家来完成。因此,迫切需要一种基于rWGS的自动化方法来帮助确定NICU中急症患者的优先顺序[8]。
04 自动化rWGS诊断优先级排序,提高患者筛选的效率
2023年3月16日,Stephen Kingsmore团队与美国犹他大学犹他基因发现中心的Mark Yandell团队合作在Genome Medicine发表了题为“Automated prioritization of sick newborns for whole genome sequencing using clinical natural language processing and machine learning”的研究文章,将临床自然语言处理技术(CNLP)与可对患者rWGS诊断优先级排序的工具孟德尔表型搜索引擎(MPSE)相结合[8]。MPSE采用源自患者电子健康记录(EHR)的基于人类表型本体论(HPO)的表型描述来计算分数,该评分可用于确定孟德尔遗传病对患者临床表现的影响,因此可用于确定患者rWGS诊断的优先级。研究显示,MPSE准确而有力地识别了Rady儿童医院和犹他大学临床专家选择的新生儿重症监护室中的WGS患者。此外,MPSE评分还可以帮助优先筛选遗传病诊断病例。最终交叉验证结果表明,基于CNLP/MPSE的rWGS全自动诊断流程可以获得相当或超过根据当前最佳实践进行人工筛选的诊断率(如图4)。
图4.研究队列MPSE的预测诊断率。MPSE评分越高,诊断概率越高。红色、绿色和蓝色曲线的负斜率表明,使用CNLP时,较高的MPSE分数与诊断先证者相关。来源:参考资料[8]
“通过改写开端,我们可以帮助家庭结束漫长的疾病诊断和治疗之旅,让他们的故事充满希望。BeginNGS的目标是帮助确保每个婴儿都得到可靠的遗传病筛查,并帮助医生及时提供有效的治疗。” ——Stephen Kingsmore博士。
RARE-X的首席执行官Charlene Son Rigby表示:“将rWGS扩展到新生儿筛查是一项重要的工作,有可能结束长达数年的痛苦诊断之旅,同时获得罕见疾病患病率的关键数据,罕见病患者的早期诊断也将为持续监测症状和收集关键数据打开大门。”
在过去十年中,WGS在速度、诊断性能和可扩展性方面都有所提高。BeginNGS将提供一种新颖的医疗保健服务系统,旨在筛查新生儿遗传病,并将他们的医生与有效的干预措施联系起来,并不会取代目前的新生儿筛查手段,而是作为现有新生儿筛查流程和基础研究的补充。随着rWGS技术在速度、诊断性能和可扩展性方面的进步,以及数百种新的基因疗法和罕见病用药的开发,BeginNGS将有效改善儿童遗传病的诊断和治疗过程。
参考资料:
1.www.Begin-NGS.org
2.https://radygenomics.org/begin-ngs-newborn-sequencing/
3.Owen, M.J., Lefebvre, S., Hansen, C. et al. An automated 13.5 hour system for scalable diagnosis and acute management guidance for genetic diseases. Nat Commun 13, 4057 (2022). https://doi.org/10.1038/s41467-022-31446-6
4.Kingsmore SF, Smith LD, Kunard CM, et al. A genome sequencing system for universal newborn screening, diagnosis, and precision medicine for severe genetic diseases. Am J Hum Genet. 2022;109(9):1605-1619. doi:10.1016/j.ajhg.2022.08.003
https://www.cell.com/ajhg/fulltext/S0002-9297(22)00355-X
5.Ding Y, Owen M, Le J, et al. Scalable, high quality, whole genome sequencing from archived, newborn, dried blood spots. NPJ Genom Med. 2023;8(1):5. Published 2023 Feb 14. doi:10.1038/s41525-023-00349-w
https://www.nature.com/articles/s41525-023-00349-w
6.French CE, Delon I, Dolling H, et al. Whole genome sequencing reveals that genetic conditions are frequent in intensively ill children. Intensive Care Med. 2019;45(5):627–36. https://doi.org/10.1007/s00134-019-05552-x.
7.Kingsmore SF, Cakici JA, Clark MM, et al. A randomized, controlled trial of the analytic and diagnostic performance of singleton and trio, rapid genome and exome sequencing in ill infants. Am J Hum Genet. 2019;105(4):719–33.
https://doi.org/10.1016/j.ajhg.2019.08.009.
8.Peterson B, Hernandez EJ, Hobbs C, et al. Automated prioritization of sick newborns for whole genome sequencing using clinical natural language processing and machine learning. Genome Med. 2023;15(1):18. Published 2023 Mar 16. doi:10.1186/s13073-023-01166-7
https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-023-01166-7