Nat Commun:超30万病例的遗传数据分析发现40种蛋白质与9种常见癌症风险相关

时间:2024-05-24 12:00:26   热度:37.1℃   作者:网络

治疗性预防是一些常见慢性病初级预防有效且常用的策略。但癌症病因复杂,难以确定潜在的靶向病因的生物标志物,因此癌症病因蛋白质被确定后可能带来新的机遇。循环蛋白质可以揭示癌症的关键途径,并帮助确定癌症及其预防的治疗靶点。在高危人群明确的情况下,利用这些蛋白质开发预防疗法有极大的潜力。许多蛋白质的血液浓度受遗传变异的调节,例如顺式蛋白质定量性状基因座变异cis-pQTL。这些方法实现了以高特异性同时对数千种蛋白质在常见癌症病因中的作用进行计算机评估。

英国牛津大学的研究团队及合作者在Nature Communications发表了题为“Identifying therapeutic targets for cancer among 2074 circulating proteins and risk of nine cancers”的文章。研究团队利用337,822例癌症病例的数据,采用顺式蛋白质孟德尔随机化和共定位研究了2074种循环蛋白质和9种常见癌症(膀胱癌、乳腺癌、肺癌、卵巢癌等)的风险。研究额外分析确定了风险蛋白质变化的不良副作用,并将癌症风险蛋白质映射到药物靶点,发现了40种与常见癌症相关的蛋白质(如PLAUR和乳腺癌风险),以及与高死亡率癌症相关的蛋白质(如CTRB1和胰腺癌)。此外,研究还确定了蛋白质改变干预措施降低癌症风险的潜在不良影响,如高血压。总之,这项研究确定了蛋白质与癌症之间的联系,从而提高了我们对癌症病因的理解。

图片

文章发表在Nature communications

01 蛋白质对癌症风险的影响

该研究使用了已发表的多达337,822例癌症病例的GWAS遗传关联数据,提取了与血液中蛋白质浓度相关的所有独立单核苷酸多态性(SNP),并且位于蛋白质同源基因(称为cis-pQTL)的1M内。研究考虑了9种常见癌症(膀胱癌、乳腺癌、子宫内膜癌、头颈癌、肺癌、卵巢癌、胰腺癌、肾癌和恶性非黑色素瘤)。结果显示,在4698个cis-pQTL中有4507个可用于至少一个癌症位点的分析(最少:膀胱癌cis-pQTL为3308个;最多:子宫内膜癌cis-pQTL为4303个),相当于该研究2074个蛋白质中有2023个可用于分析(图1)。

图片

图1. 基因预测蛋白质浓度与癌症风险关联的曼哈顿图。

研究利用孟德尔随机化和共定位全表型关联分析(PHEWAS)分析确定了40种与至少一个癌症器官相关的蛋白质(图2)(卵巢癌症最少:1种蛋白质;乳腺癌最多:21种蛋白质)。另外428种蛋白质被鉴定为具有共定位的证据(PP4>0.7)并显著与癌症风险的孟德尔随机化相关(皮肤癌最少:8个蛋白质;乳腺癌最多:241个蛋白质)(图1)。表明蛋白质与透明细胞卵巢癌、有吸烟史的肺癌、HER2富集、lumina B和lumina B-HER2阴性乳腺癌的风险相关。此外,在孟德尔随机化分析中,没有从多个独立的cis-pQTL中发现任何蛋白质是癌症的危险因素。

图片

图2. 40种蛋白质与癌症风险相关性的Forrest图及PLAUR和CTRB1的泛癌症风险Forrest图。

02 蛋白质与其他性状的关联  

该研究确定了许多与癌症风险相关的蛋白质与非癌终点的关联,这可能为确定它们与癌症关联的特异性或任何潜在治疗干预的效用提供信息。值得注意的是,没有观察到SFTPB、EGFR和GAS1与其他特征的任何关联,这些基因特征分别与较低的肺腺癌风险、较高的乳腺癌总体风险和三阴性癌症风险相关。研究人员重点探究了与癌症风险增加相关的两种蛋白质:FGFR3和PDXK,作为干预降低蛋白质以减少癌症风险可能后果的代表性分析(图3)。

较高的FGFR3与膀胱癌风险增加相关。但研究观察到FGFR3降低可能会对其他常见的疾病产生潜在的有害影响,如髋关节或膝关节骨关节炎的风险更高,正常步行速度降低,循环雌二醇水平更高,循环白蛋白质更低。同时,较低的FGFR3也可能有其他潜在的有益后果,例如肾脏体积较大。  

较高的PDXK与乳腺癌风险增加相关。但PDXK降低也与更高的高血压风险有关。PDXK降低还与更高的嗜酸性粒细胞计数(SD)以及眼睛和附件疾病有关,不过过敏性鼻炎的风险较低。

图片

图3. 基因预测的蛋白质改变干预措施的潜在后果(以FGFR3和PDXK为例)。

此外,超色谱分析发现,8个蛋白(A4GALT、ASIP、CTSF、MARE1、PDXK、SEM4A、PLAUR、VARS1)在指标蛋白、中间表型和指标癌症终点之间存在多性状共定位的证据,这可能有助于阐明癌症风险的病因学途径。数据分析发现,31个癌症风险蛋白的pLI评分<0.1,这意味着对功能变异丧失的耐受性很高。相反,两个蛋白DDX39B和MAPRE1对LoF变异表现出高度不耐受性,pLI>0.9。

03 药物靶点pQTL分析

研究团队将孟德尔随机化和共定位分析限制在具有同源基因的cis-pQTL上,该同源基因是确定的867种现有药物中一种作用的既定药物靶标,并对值得注意的药物靶蛋白进行评估。结果显示,在同源基因被定位到至少一种癌症结果的已知药物靶点的488种蛋白质中,有473种蛋白质可获得协调cis-pQTL。在多重检验校正后,发现有18种蛋白质可映射到药物,这些药物与至少一种癌症终点风险相关。其中包括被至少一种药物干预的乳腺癌(8个蛋白质)、肺癌(3个蛋白质)、头颈癌(2个蛋白质)、肾癌(2个蛋白质)、恶性非黑色素瘤(3个蛋白质)、膀胱癌(1个蛋白质)以及胰腺癌(1个蛋白质)。此外,研究还确定了8种I期临床试验或更高阶段研究中药物靶点的蛋白,其中8种蛋白目前处于临床前阶段或生物测试阶段,同时确定了与癌症风险相关的15种蛋白质,包括SFTPB和GAS1,似乎没有作为药物靶点进行积极研究(图4)。   

图片

图4. 当前最高水平的治疗研究中与癌症相关的已识别蛋白质。 

综上所述,该研究对9种常见癌症的2074种蛋白质进行了综合性评估,确定40种蛋白质可能在至少一种癌症的病因学中发挥作用,这些蛋白质也介导了特定药物的治疗效果,从而可能导致药物再利用。此外,研究还发现了似乎还没有得到积极研究的癌症相关蛋白质,它们可能代表着开发新癌症治疗方法的机会。该研究使用的基于cis-pQTL的孟德尔随机化和共定位分析可以形成互补,对于表征蛋白质的疾病特异性和多效性十分重要。这些结果为理解潜在的蛋白质改变干预的病因途径和潜在的不良后果提供了重要背景,为癌症预防提供新选择,并可能成为限制癌症发病率预期增长所需的临床策略的一部分。

在另一文章中,牛津大学Keren Papier教授团队及合作者使用综合多组学方法鉴定了血液蛋白和癌症风险之间的多重关联。通过分析UK Biobank参与者的1463种血浆蛋白与19种癌症和9个癌症亚部位的发病率的关联,研究团队利用顺式-pQTL和外显子组全蛋白质遗传评分(exGS)两种遗传方法确定了618种蛋白质-癌症关联,其中107种在抽血7年后确诊的癌症病例中持续存在,其中4个得到长期诊断的支持:肺癌与SFTPA2 ,非霍奇金淋巴瘤与TNFRSF1B和CD74,白血病与ADAM8。该研究提供了关于多种癌症的病因和生物学的新线索。(点击查看此前报道)

论文原文:

Smith-Byrne, K., Hedman, Å., Dimitriou, M. et al. Identifying therapeutic targets for cancer among 2074 circulating proteins and risk of nine cancers. Nat Commun 15, 3621 (2024). https://doi.org/10.1038/s41467-024-46834-3

上一篇: J Hepatol:翟巍巍等多团队合作通...

下一篇: J Ethnopharmacol:桃红四...


 本站广告