PLOS Med:超万人EWAS研究揭示与多种常见疾病关联的甲基化位点

时间:2023-07-26 11:22:37   热度:37.1℃   作者:网络

DNA甲基化是最早被发现、也是目前研究最充分的基因表观遗传修饰方式,其通常发生在胞嘧啶-磷酸-鸟嘌呤二核苷酸(CpG)位点。DNA甲基化在维持正常细胞功能、染色体结构、胚胎发育过程、衰老以及疾病的发生中起着重要的作用,也是环境与基因组相互作用的重要机制。了解DNA甲基化的机制和功能将对人类健康与疾病研究产生深远影响。

全表观基因组关联研究(EWAS)是研究复杂疾病遗传学基础的一种有效方法,可以了解CpG位点甲基化比例与相关健康结果之间的关系。EWAS通常使用全血DNA进行分析,常见的疾病EWAS可大致分为患病率分析和发病率分析。先前的EWAS样本量有限(< 1000人)且通常只关注个体状况,限制了疾病状态相关基因位点的发现。因此,目前亟需进行大规模的EWAS,以检查单一人群中多种疾病状态的患病率和发病率,有助于确定血液DNA甲基化作为常见疾病状态的外周标志物的相关性。

近日,英国爱丁堡大学的科研人员在PLOS Medicine上发表了题为“Blood-based epigenome-wide analyses of 19 common disease states: A longitudinal, population-based linked cohort study of 18,413 Scottish individuals”的研究文章。研究团队对包含18,413名个体DNA甲基化数据的大型苏格兰Generation Scotland(GS)研究队列进行EWAS分析,检测了CpG位点的甲基化差异与14种疾病状态的患病率和19种疾病状态的发病率的关系该研究共确定了100多个CpG甲基化位点与4种疾病的患病率(乳腺癌、慢性肾病、缺血性心脏病和2型糖尿病)和2种疾病的发病率(慢性阻塞性肺病和2型糖尿病)之间的关联。

图片

文章发表在PLOS Medicine

图片

图1.对研究队列疾病状态进行EWAS的研究设计。

14种疾病患病率的全表观基因组分析

研究团队对18,413名参与者全血样本进行分析,在752,722个CpG位点进行了DNA甲基化分析。首先整合了血液DNA甲基化数据和基线研究中自我报告的疾病数据,对14种常见疾病状态进行EWAS(患病率分析)(图2)。在构建的基本模型中,血液CpG甲基化与10种疾病之间存在1,340个显著关联,超90%的关联与2型糖尿病、慢性阻塞性肺病(COPD)和慢性疼痛相关

接下来,研究团队对模型进行了全面调整,进一步考虑了5种常见生活方式风险因素和人口结构的影响,即饮酒量、体重指数、贫困程度、吸烟和受教育年限。结果显示,完全调整模型显示出与8种疾病状态相关的78个关联;基本模型中的69个关联也出现在完全调整模型中。这69个关联分布在4种疾病状态中:慢性肾病、缺血性心脏病、乳腺癌和2型糖尿病。分析发现,参与者自我报告的乳腺癌史与cg06072257和cg06123699的低甲基化之间存在关联,其分别位于1号染色体和3号染色体上的UBIAD1和TPRG1附近。此外,注释为ABCG1、DHCR24和MYLIP的CpG甲基化在缺血性心脏病和2型糖尿病中较常见。

图片

图2. 研究队列中14种流行疾病状态的表观基因组关联研究。

19种疾病发病率的全表观基因组分析

通过电子健康记录链接进行长期跟踪监测,研究团队确定了19种突发疾病状态并进行了EWAS,以探究基线研究时检测的CpG甲基化位点是否与这19种疾病状态的未来发病相关(图3)。在基本模型中,研究团队观察到CpG甲基化与11种疾病状态的发病率之间存在14,237个关联,其中79.4%和18.7%的关联分别与COPD和2型糖尿病相关。

在完全调整模型中,有79个独特的关联分布在5种疾病状态中。在基本模型和完全调整模型中,仅存在64个与COPD和2型糖尿病相关的共同关联。与COPD相关的CpG注释基因包括ALPG、C11orf91、CPOX、GPR15、HLA-DRB5PRSS23;与2型糖尿病相关的CpG注释基因包括ABCA1、ABCG1、CPT1A、SREBF1、SLC7A11、SLC7A5TXNIP等。

研究团队在完全调整模型中进一步分析,检测了5种常见生活方式风险因素对上述关联的减弱作用。结果显示,每个协变量对效应大小的平均衰减范围从5.5%(体重指数)到63.1%(吸烟)不等,鉴于不同疾病状态的风险特征不同,其存在异质性

图片

图3. 对队列中19种疾病进行全表观基因组关联研究。

最后,研究团队对现有文献进行了结构化的回顾分析,以确定涉及的19种疾病状态的基于血液EWAS结果。研究团队检验了该研究结果是否重复了之前的分析,并量化了已发表研究中的一致性水平。结果显示,只有11个普遍关联(1个慢性肾脏病有关,10个与2型糖尿病有关)和8个突发事件关联(仅与2型糖尿病相关)在文献中被报道。这一结果表明,与全基因组关联研究(GWAS)相比,EWAS的可重复性普遍较低,其中可重复性最高是肺癌相关研究

图片

图4. EWAS中常见疾病状态的查找和重复分析。

结 语

综上所述,研究团队使用世界上最大的甲基化数据集之一,对多种疾病的患病率和发病率进行了一系列EWAS,并对现有文献进行了大规模、全面的回顾分析。通过将这些数据与该研究结果进行比较,研究团队发现了与3种疾病状态(乳腺癌、缺血性心脏病和2型糖尿病)患病率相关的58个新关联,以及CpG甲基化位点与2种疾病状态(COPD和2型糖尿病)发病率之间的56个新关联,其与常见的生活方式风险因素无关。该研究提示,血液DNA甲基化可以作为几种常见疾病状态的外周生物标志物,包括乳腺癌、心肺疾病和2型糖尿病。

参考文献:

Hillary RF, McCartney DL, Smith HM, Bernabeu E, Gadd DA, Chybowska AD, et al. (2023) Blood-based epigenome-wide analyses of 19 common disease states: A longitudinal, population-based linked cohort study of 18,413 Scottish individuals. PLoS Med 20(7): e1004247.

https://journals.plos.org/plosmedicine/articleid=10.1371/journal.pmed.1004247

上一篇: 术中死亡丨急性心梗粗大前降支次全闭塞造影...

下一篇: 常见的呼气末二氧化碳波形在提示些什么?


 本站广告