Diabetologia:利用生物标志物和患者电子数据推导和验证机器学习风险评分,以预测糖尿病肾病的进展
时间:2021-10-08 12:02:13 热度:37.1℃ 作者:网络
背景介绍:大约每四个患有2型糖尿病的成年人中就有一个患有肾脏疾病(即糖尿病肾病[DKD])。在美国,每年有5万名DKD患者进展为肾衰竭。EGFR和尿白蛋白肌酐比(UACR)的测量已被纳入肾脏疾病:改善全球预后(KDIGO)的风险分层指南,但这些不能准确识别将经历快速肾功能下降(RKFD)的患者。因此,初级保健医生和糖尿病医生不能对DKD的进展性进行适当的风险分层和咨询。缺乏整合到临床工作流程中的易于理解和准确的预后工具,导致不理想的治疗和延迟转诊至肾病专家。这在一定程度上造成进行性DKD和肾衰竭的不可接受的负担,有很高比例的患者开始了非计划的透析。
一些血液的生物标志物与DKD的进展相关,其中最显著的是可溶性TNF受体1/2(TNFR1/2)和血浆肾损伤分子-1(Kim-1)。然而,将患者电子健康记录(EHR)的临床数据与血液的生物标记物相结合的准确预后模型尚未实施。尽管EHR数据广泛可用,但其数量和复杂性限制了使用传统方法与生物标记物价值的整合。机器学习可以将生物标记物和EHR数据结合起来,产生预测风险分数。我们先前证明,在2型糖尿病和APOL-1高危基因型患者中,结合生物标记物和EHR数据可以比临床模型更好地预测肾脏结果。一个简单的风险评分可以提高识别肾功能进行性下降的低、中、高风险的DKD患者的能力,它有可能通过更有效地使用药物和在初级保健医生水平上有效地分配资源来改善预后。
目的:预测糖尿病肾病(DKD)的进展对改善预后至关重要。我们试图开发一种结合电子健康记录(EHR)和生物标志物的机器学习预后风险评分(KidneyIntelX™)。
方法:这是一项对来自两个EHR相关生物的队列研究。训练随机森林模型,将其检测性能(AUC、阳性和阴性预测值[PPV/NPV]和净重分类指数[NRI])与临床模型和肾病进行比较:改善全球结局(KDIGO)类别预测eGFR下降≥5 ml/min /年、持续下降≥40%或5年内肾衰竭的复合结局。结果:1146例患者中位年龄为63岁,51%为女性,基线eGFR为54 ml·min - 1[1.73 m] - 2,尿白蛋白/肌酐比值(uACR)为6.9 mg/mmol,随访4.3年,21%有复合终点。在衍生交叉验证(n= 686)中,KidneyIntelX的AUC为0.77 (95% CI 0.74, 0.79)。验证(n=4 6 0)A U C为0.77 (95% CI 0.76, 0.79)。相比之下,临床模型的衍生AUC为0.62 (95% CI 0.61, 0.63),验证AUC为0.61 (95% CI 0.60, 0.63)。使用衍生临界值,KidneyIntelX将46%、37%和17%的验证队列分别分为低、中、高危组,以确定复合肾脏终点。根据KDIGO分类,高危组肾功能进行性下降的PPV为61%,高危组为40% (p< 0.001)。在使用KidneyIntelX评分为低风险的患者中,只有10%的患者出现进展(即NPV为90%)。高危组的NRIevent率为41% (p<0.05)。
图1 Shapley加性解释(Shap)曲线图显示相对特征重要性。形状汇总绘图根据要素的重要性对要素进行排序。每个图由训练数据集中的各个点组成,值越高,紫色越深,值越低,颜色越黄。如果中线一侧的点呈紫色或黄色,则表示这些值分别在增大或减小,从而使预测朝该方向移动。例如,收缩压越高,复合肾结果的风险越高。AST,天冬氨酸转氨酶
图2 (A)KidneyIntelX预测派生集合中的风险,(B)KidneyIntelX预测验证集合中的风险,以及(C)根据派生和验证集合中复合肾脏终点的风险来预测DKD患者的KidneyIntelX得分分布。(a,b)事件用橙色圆点(进展)表示,代表5年内的复合肾脏终点。无事件用蓝点表示(无进展),表示在随访期内没有复合肾事件。(C)点代表累积发病率:蓝色,低风险10%(6%,14%);粉红色,中度风险22%(16%,28%);红色,高风险61%(50%,71%)
表 KidneyIntelX的测试特点和综合临床模型
图3 KidneyIntelX风险分层的Kaplan-Meier曲线显示,在衍生(A)和验证(B)集合中,EGFR持续下降40%或肾衰竭的终点。衍生出的用于验证的风险界限为:低风险0.061129-0.061129,中等风险0.061129-0.30209,高风险0.30209-1。在衍生集合中,45%为低风险,40%为中度风险,15%为高风险。在验证组中,46%为低风险,37%为中度风险,17%为高风险。高危与低危的HR在推导时为18.3(95%CI 10.1,33.1),在验证时为14.7(95%CI 7.8,27.6)。高危与中危的HR在推导时为5.7(95%CI 3.7,8.7),在验证时为6.0(95%CI 3.5,10.0)。高风险与低风险和中风险合并的HR在推导时为9.2(95%CI 6.2,13.6),在验证时为9.1(95%CI 5.8,14.4
结论:与KDIGO和临床模型相比,Kidneyintelx能更好地预测早期DKD患者的肾脏预后。
原文出处
Chan L, Nadkarni GN, Fleming F,et al,Derivation and validation of a machine learning risk score using biomarker and electronic patient data to predict progression of diabetic kidney disease.Diabetologia 2021 Jul;64(7)