NAR:港城大李帅成团队开发水平基因转移检测新算法,揭示肠道微生物水平基因转移和CRC的功能关联

时间:2024-06-30 23:01:39   热度:37.1℃   作者:网络

图片

2024年6月17日,香港城市大学计算机系李帅成课题组Nucleic Acids Research上在线发表了题为“Enhancing insights into diseases through horizontal gene transfer event detection from gut microbiome”的文章。研究团队开发了在肠道微生物中快速检测水平基因转移(HGT)的软件LocalHGT,并应用该软件揭示了HGT和疾病的功能关联,发现HGT作为生物标记可有效提高疾病预测准确率。这一研究深化了对人体肠道中复杂HGT事件的理解,也为微生物组研究提供了新的研究方法和分析视角。

HGT是指在不同有机体之间所进行的遗传物质的交流。HGT对微生物的进化和环境适应性非常重要。HGT可以促进耐药基因和致病因子在微生物之间的传播。人体肠道中有大量的HGT事件,它们跟人体的健康息息相关。然而,我们对肠道中HGT的认识还很有限,这由于缺乏可靠的肠道HGT检测软件。传统的HGT检测方法都是基于单个基因组,不适合肠道测序样本。近年来,有基于比对或组装的软件问世,然而组装和比对都十分耗费计算资源,这限制了它们在大规模研究中的使用。另外,还没有方法可以检测完整的HGT事件,即包括转移的DNA片段,还有相关的deletion和insertion断点。

图片

图1. LocalHGT的方法示意图

为了填补以上空白,研究团队开发了一款可以在肠道微生物中快速准确检测完整的HGT事件的软件LocalHGT(图1)。LocalHGT利用k-mer从大型的参考基因组中快速识别HGT-related segments,即可能包含HGT断点的参考基因组片段。接着LocalHGT把reads比对到HGT-related segments上,通过split-read来识别HGT断点。最后,LocalHGT通过配对HGT断点来检测完整的HGT事件。基准测试显示LocalHGT实现了高准确率和高效率。在200个真实的鸟枪法测序样本中,LocalHGT实现了99.4%的完整HGT事件检测准确率。相比于传统方法,在处理人体肠道微生物组时,LocalHGT消耗的CPU time减少了82.7%。

图片

图2. 人类肠道微生物组中HGT的特征

基于LocalHGT,研究团队系统地在2098个人体肠道微生物样本中检测并分析HGT,对人体肠道的HGT有了更全面的认识。这些样本包含不同的疾病表型,包含结直肠癌(CRC)、二型糖尿病(T2D)、炎症性肠病(IBD)、腺瘤和急性腹泻。研究团队发现,人体肠道中有丰富的HGT事件,平均而言,每个样本包含559个HGT断点对。在单个个体中,一个水平转移的DNA片段可以有多个不同的插入位置,并且这些转移可能是在该个体中新近发生的。另外,研究发现HGT发生的频率与相关基因组之间的系统发育距离呈负相关。

图片

图3. HGT突变机制的推断

此前研究表明,微同源现象(Microhomology)在人体基因组结构变异的断点接头处富集。该研究首次发现微同源在HGT的断点接头处富集(p = 3.3e-58),这表明微同源介导的变异机制在HGT事件形成中发挥重要作用(图3)。此外,研究还发现NHEJ和alt-EJ是主要驱动HGT事件的突变机制,这与非癌人体基因组和癌症人体基因组都不同。

图片

图4. HGT是个体特异的,并与微生物适应性相关

研究团队发现,在肠道微生物组中HGT表现出两个明显特性(图4)。首先,HGT可以作为宿主的个性化标志。在时间序列样本中,同一个个体不同时间点样本之间的HGT相似度远远高于不同个体之间的HGT相似度(p=4.3e-303)。这表明和SV与SNP单倍型一样,HGT也可以作为微生物组的特异性指纹标记。其次,HGT事件与微生物适应性密切相关。功能富集分析发现,HGT相关的基因富集在防御机制和分泌相关的功能中,这表明HGT对微生物的进化和环境适应性十分重要

图片

图5. HGT在人类疾病的关键KEGG通路中富集

HGT可能会破坏短链脂肪酸(SCFA)的生成,从而促进CRC的发展(图5)。在CRC相关的HGT中,脂酸代谢通路是最显著富集的,其次是丁酸代谢通路。众所周知,丁酸生产的减少会导致CRC患者肠道微生物群结构失衡。丁酸代谢通路在CRC关联的HGT中富集,这表明HGT可能会损害CRC患者的丁酸生产。在所有SCFA中,丁酸是最富集的,其次是丁酰辅酶A、琥珀酸和丙酮酸(图5C)。这些结果表明,HGT可能会破坏CRC患者肠道微生物中多种SCFA相关化合物的生成,从而促进CRC的发展。

图片

图6. 对利用HGT作为biomarker的疾病预测模型的评估

肠道微生物组中的HGT可作为biomarker预测多种人类疾病(图6)。研究团队利用疾病与对照组之间的差异性HGT作为biomarker,对多种疾病进行预测。预测CRC、IBD、T2D、IGT和腹泻的AUC分别为0.82、0.79、0.61、0.91和0.98(图6A)。这表明,HGT可以作为有效预测CRC、IBD、IGT和急性腹泻的biomarker,但在预测T2D方面表现相对较差。此外,研究人员发现将HGT和微生物丰度biomarker整合在一起可以提高CRC的预测性能。在八个CRC队列的LODO验证中,单独使用微生物丰度的AUC为0.81,加入HGT后AUC提高至0.87(图6D)。

图片

图7. HGT网络与人类疾病相关

HGT网络展示了与人类疾病相关的重要细菌。在对照组、CRC、腺瘤、IGT、T2D和IBD之间,群体HGT网络结构相似(图7A-D)。这些组中,重要的节点主要属于Firmicutes_A和Bacteroidota。这两个门在群体中具有最高的HGT频率。然而,在腹泻组中,重要的节点富集在Proteobacteria中,该门被视为腹泻的致病因素。除了腹泻和IGT,所有组中最重要的节点是Bacteroides_B dorei。而在腹泻中,最重要的节点是E. coli_D,其次是Escherichia albertii。先前的研究已经发现这两种细菌对腹泻的重要作用。在IGT组,最重要的节点是Agathobacter rectalis,其次是Agathobacter faecis,该结果表明这两种细菌与IGT可能有潜在关联。

综上所述,LocalHGT使得对微生物组中的HGT进行系统性研究成为可能,其在促进对疾病机制研究和临床诊断方面具有重要作用。

原文链接:

https://doi.org/10.1093/nar/gkae515

上一篇: J Ethnopharmacol:四妙丸...

下一篇: 【衡道丨干货】2024版CSCO指南更新...


 本站广告