《梅斯药说》第六期 真实世界研究的“数据之困”

时间:2022-10-16 12:04:32   热度:37.1℃   作者:网络

近年来真实世界的研究发展势头迅猛,不同于传统临床实验,真实世界研究不仅可减少限制,还能反映真实世界中治疗药物的临床疗效,对于临床决策和指导更具有实际意义。

中国真实世界研究的发展虽刚起步,但随着政策支持以及药械企业需求的增长,国内外企业正纷纷布局,相应机构和平台中心也相继成立。伴随而来的是数据的质量管理、合规以及伦理等问题,其中最为人关注的就是真实世界研究的核心和前提 —— 真实世界数据。

图片

2022年5月27日19:30,梅斯医学直播栏目《梅斯药说》第六期,由梅斯医学CEO樊杰先生主持,邀请到浙江人民医院科研部、肿瘤内科主任医师杨柳教授、赛诺菲中国真实世界研究团队副总监王艳女士和梅斯医学医院信息事业部负责人王良先生作客直播间,三位嘉宾给大家带来了一场收获满满的会议讲座。

图片

TOPIC 01 临床角度谈一谈真实世界研究的数据采集探索

浙江人民医院科研部、肿瘤内科主任医师杨柳教授  

图片

真实世界的研究特别重要,因为医院的常规考核除了临床业绩和绩效,还包括科研考核

医院经常鼓励医生参与国家自然科学基金,虽然大部分只是做基础科研,但对医生而言,只有极少数人具有做基础科研的资源。所以医院希望医生回归临床,在临床中凝练问题。而往往通过原始病历系统提取,经人工整理,统计分析,寻找目标病例,都会花费大量时间。

恒瑞公司的新药艾坦上市时,非常巧妙地通过一位大夫在著名杂志发布了一篇高质量的真实世界的临床研究的文章而产生重要影响力。

中山大学肿瘤医院建立了系统的专病库和专科库。通过数据库进行临床研究,同时发表了众多基于临床研究的高质量文章,也改变了很多指南和专家共识,因此全国知名专家以及医院非常重视建设专病数据库。

划重点:

真实世界研究并不需要太多干预,完全可利用平时的临床资源去完成。根据确立的临床科学问题,来确立研究者想要做的研究目标、研究方案和研究内容。但如果希望冲击更高水平的杂志,就需要大量的原始数据。

TOPIC 02 如何获得高质量的真实世界数据?

赛诺菲中国真实世界研究团队副总监 王艳女士

图片

有希望有期望,才有困惑。

要先明确临床研究的需求:是为注册使用还是为证明上市后的安全性及有效性,是为了形成专家共识或只是探索性研究需求。

观察性研究,一直是临床研究的重要组成部分。除了RCT,观察性研究得到的数据都没有干预、双盲,甚至一些数据在设计上就有缺陷,数据在质量上和范围上要求都不一样。

2016年的美国21世纪治愈法案,第一次提出了真实世界研究的概念。2021年9月,美国FDA发表了关于真实世界研究的白皮书和EMR、Registry数据注册指南,但没有太多真正操作性指南。中国CDE在2021年初发表了两个指南,关于详尽指导真实世界证据用于注册和用真实世界数据来产生证据。

从2017年到2020年,FDA在肿瘤领域有13个真实世界证据,申报来源主要通过阅读病例。鉴于回顾性研究的数据来源会产生偏移和混杂因素的问题,这些肿瘤研究的终点基本上是ORR,在临床记录上无进展生存时间和总生存时长,缺失数据的比例较大,不易找到终点数据,不同终点的评估办法也不一样。

国内CDE在2018、2019年用3个真世界研究的数据来提交扩适应症,和在博鳌作为商品药物使用的普拉替尼都是利用国外获批的数据。真实世界数据都是作为一个支持性数据来提交的。有些药物即使已经有大型的多中心三期临床在进行,纳入较大量的中国地区病例,但目前并没有把真实世界数据作为主证据来递交的例子。

真实世界数据适用场景较多,一般企业研发部门会作为新适应症的注册申请或医学部门扩适应症的上市后研究。2022年3月份,医生法出台规定了对于临床肿瘤药物超适应症使用的规范。对于肿瘤晚期病人,超适应症使用较多。所以EMR系统里沉淀的超适应症使用数据是非常好的数据来源。2012年开始,医院很多科研平台都在为癌症晚期患者做细胞治疗提供数据和支持。根据卫计委的要求,医院计划建立上报数据的采集系统,通过大数据分析、提取,自动生成上报报表并提交。

IBM的沃森通过跟肿瘤医生合作,在乳腺癌患者中采取病例做过类似研究。发现主治医生的处方和疗法跟指南最接近,但肿瘤治疗较为个性化,越资深的医生要考量的因素会越多,不是完全照搬。所以指南就是根据不同的阶段来用不同的治疗模式。

王艳女士谈到2017年参加温州乳腺癌会议演讲时,发现听众接受度不高,且当时EMR系统里的数据来自不同的公司和医院,不仅有部分缺失,也过于孤立和分离。所以整合程度和整合结果并不理想。

即使现在真实世界数据得到很多指南和专家的认可,但也有认为目前国内对于真实世界数据的应用过快,RCT较大的诟病是外推性不好。真实世界数据内部和外部的真实性都无法控制,无论是研究设计还是分析方法,目前有很多根据真实世界数据衍生出来的统计学方法,都能更好地平衡偏移,得到更稳健的研究结果。

国内很多专家和临床医生都认为现在的EMR系统有大段文字记录,不能作为结构化数据来直接用于分析。他们希望更改EMR结构,让每一个产生的数据都可以直接用于分析。肿瘤医生的病历记录会相对详细,但皮肤科和介入科的病历记录会过于简洁,并不能使用。建立全国统一EMR,打通医院间数据孤岛,让数据产生连贯性是接下来的目标。

目前临床作为研究对照还缺失很多关键性的数据,但可以作为疾病背景的自然史研究数据来递交,这样对于数据的要求就没有那么的高。对于使用真实世界数据作为对照,Flatiron是比较好的EMR数据生产商,它的数据比较完善,且同时提交了关于有ROS-1的基因位点的探索,但数据是不是反应了真实世界中诊疗现况,对于监管机构的接受程度还是非常重要的。

划重点:

近年来真实世界研究的火热是由于监管机构将它纳入可作申报的数据组成。但无论是药企还是医院,临床机构和研究机构对流行病学观察性研究都是在长期进行实验。建立全国统一EMR,打通医院间数据孤岛,让数据产生连贯性是接下来的目标。

TOPIC 03 怎样从零到一搭建真实世界专病数据台?

梅斯医学医院信息事业部负责人 王良先生 

图片

临床医生在没有课题和具体方向时,团队该如何进行数据收集和采集?

1、参考国际通用模型,国外的数据库,该疾病相关的文献,指南,专家共识中所提到的所有字段,确保当前制定的数据集或模型是完整的、先进的。

2、建立特定疾病的专科数据模型,按照数据模型,从检验,检查,病理,超声,放射手术报告里提取字段,进行归一,转换,标准化处理。

数据库搭建时的难点在哪?

数据的模型建立需要有医学背景。

数据的指控需要有统计学背景

数据的采集需要有IT背景

快速搭建专科数据库的方法论:建设一个中心,2个平台,5类应用和8个建设步骤。

为什么要建立专病数据库?帮助研究者能实现如下需求:  

1、快速、准确的大样本单病种数据筛选和临床研究

2、连续、完整、再利用的信息资产的可持续建设

比如:某冠心病患者的最近做过支架手术,还需知道病人是否也有消化道的其他疾病。

2个平台解决什么问题?

1.数据库平台

一方面,制定相对宽松的入库规则,用先进的IT工具实现数据自动化抓取,病人就诊信息会持续更新到数据库中,就可以自动化收集全量、完整的专病就诊数据。

另一方面在做队列研究时,很多缺失或没有被录入的数据可以通过CRF进行补充。根据以往数据库建设经验,我们会把患者历次就诊信息进行关联,方便录入。

2.数据治理平台

按照专病数据模型,基于自然语言处理技术对专病数据进行数据清洗、患者数据关联、值域重新定义、诊断归一、映射、转换,脱敏等步骤,实现自动化、标准化的数据治理工作。便于满足研究过程中对数据的检索、查询、统计等需求。

五类应用功能

1. 提供科研辅助功能:为多中心临床科研提供统一的科研辅助服务,为基于科研平台提供统一的科研服务与科研活动的依托。实现数据查询,检索,科研项目管理、统计分析等功能。

2. 科研随访功能:实现多途径收集患者出院后的随访数据和院后的转归信息,完善患者疾病数据链。

3. 提供临床CRF表单功能:快速便捷的CRF科研表单填写及录入,填写CRF表单时,可在右侧自动展示关联的临床参考信息,极大方便研究者对前瞻性临床研究数据的收集。

4. 结构病史文书录入系统:收集高质量诊疗数据,提升科研数据质量,已定制开发结构化表单式手术报告及文书录录入系统。实现高质量,标准化的数据采集模式。

5. 全息360临床科研集成视图:以专病科研维度的全息360视图。

八大建设步骤

1. 确定收据的数据范围:包括院内诊疗数据、保险数据、穿戴数据、分中心医院的数据。

2. 确定入组的患者:患者入组到专病数据库,避免遗漏;比如:做过冠脉支架手术的病人,他同时又去消化科看了门诊,这部分病人我们要不要?

3. 入库规则:诊断描述、诊断ICD码,就诊科室、用药,检验检查指标等作为入库条件

4. 定义专病数据集:我们如何来定义数据集呢?需要跟临床医生一起制定。比如参考国际通用模型,国外的数据库,文献,指南,专家共识所提到的所有字段。

5. 数据建模型:根据定义好的数据集,在专病数据库里建立专病的数据模型,基于该模型实现数据治理和数据分析。

6. 数据治理:我们会按照专病数据集的要求,把相关检验报告、检查报告、入院录、手术记录、出院小结等系统中字段进行结构化处理,并对值域重新定义、诊断归一、映射、转换等结构化处理工作。

7. 质控分析:

1)数据字段的检验:

单个字段的值校验

多个字联合的校验

业务一致性判断

2)检查数据条数有无缺失

比如当前病例条数,入院/出院诊断条数,手术记录条数,用药条数等。

比如年龄:进行分层。就诊年龄、出院年龄、死亡年龄等都要做判断。

8. 随访:

目前很多专病库的随访效果不好,难度比较大,需要大量人力、物力的投入进行随访。

临床医生忙于临床工作,没有专职的医护人员进行随访。我们目前在通过信息技术手

段实现多种途径的随访方式,尽可能进行患者出院后的随访数据的收集与管理,比如通

过电话,短信,微信,APP,小程序等方式进行随访管理和推送问卷。

划重点:

快速搭建专科数据库的方法论:建设一个中心,2个平台,5类应用和8个建设步骤。建立专病数据库能帮助研究者能实现如下需求:   

1、快速、准确的大样本单病种数据筛选和临床研究

2、连续、完整、再利用的信息资产的可持续建设

灵魂拷问:

Q 1:在RWD采集方式方面,有哪些国际上的优秀经验可供借鉴?

杨柳教授:

美国FDA对于RWD数据的溯源性会非常高,对于真实界数据是存放在哪个数据库,纸质或电子病历,还是提取整合与特定疾病或者治疗的数据库?像注册登记研究等都要保证与原文件的一致性,可能包括院内院外诊疗的信息实验室以及影像的信息,患者偏好,自曝信息,医疗器械的识别号以及操作信息等。

加拿大数据质量的要求按研究的类型进行区分。主要归为两大类:

1. 前瞻性数据收集:需要严格的临床试验的收集数据,明确定义并透明化的收集过程以确保数据质量,尽可能提供预期收集的数据清单。

2. 回顾性数据:基本要求也与前瞻性研究相同,所有数据都要有可溯源性。除此之外,回顾性研究通常会有缺失数据的风险,因此也应明确利用何种统计学的方法来解决组间的可比性和缺失数据。中国的mpa对RWD的数据提出了一个4点要求,分别是完整性,准确性、透明性和质量保证。

基于后续的数据库和人工智能方式要遵循可归因性、易读性、同时性、原始性、准确性、完整性、一致性以及持久性和可用性的原则,这是对基本的高质量临床数据的通用标准。

Q 2: 数据作为提交监管机构的需求时,采集应该遵循什么样的原则?

杨柳教授:

如果要提交监管,对于数据的要求要等同于GCP,区别在于干预性较少时,会出现数据偏移和误差,此时应该通过扩大样本量来达成试验目标。在数据采集上,质量应该不亚于RCT。RWD的数据如果要能跟真实世界研究的证据划等号,过程会比较辛苦。所以大部分真实世界数据的应用是为了发表文章。如果是作为证据提交给监管机构,还应提高数据要求。

Q 3:无论研究者,药企,管理部门可以为RWD的应用做些什么?

王艳总:

药企对于数据的目的性要求会很强,不同部门对于数据的期望值不同。希望RWD可以越来越完整和透明,溯源也越来越好。在统计部门、IT部门和其他职能部门与管理者的共同努力下让数据能够更好的呈现出来。

杨柳教授:

作为研究者,我们真心想跟药企进行合作收集RWD的数据。希望可以得到国际上的认可并真正应用起来。二三线城市的医院可能会为了发表文章和做研究来获得RWD数据,但更高层次的医院医生则希望利用自己的资源和药企一起提升RWD质量,使证据迈进。

Q 4:专病数据库建立的难点在哪?

王良总:

性价比。数据的采集是无止境的,目前会通过很多深入的方法来进行多元数据采集和统计结果的转化,这是一个多学科多部门长周期的建设过程,可能中途就会出现人员、经费上的投入不足导致数据库建设终止,并且后期的维护工作也是很大投入。医院和建设者们应该仔细评估考核此事。

杨柳教授:

医院方。浙江医院都很重视建立人工智能和数据化改革,目前很多医院在做智慧医疗,所以市场很大。我们希望每个医院都能根据自己的特长和需求,建立拥有特色的专病数据库,推动科研发展。

王艳总:

药企方。药企也有根据疾病来建立数据的方案和计划,但为了得到更完善的数据资源,药企希望能跟医院合作。

Q 5:如何在保护患者个人隐私的情况下,得到患者的知情同意,拿到合法合规的数据?

王良总:

目前医院的管控力度比较严格,即使是信息部门提供的随访电话,也无法查看真实号码信息。可以通过住院和手术病人填写的知情同意书解决伦理问题,或借助微信或第三方app的推送服务,让患者在注册账号时得到患者的诊断数据。

尾声:

由于时间关系,梅斯医学CEO樊杰先生不得不结束今晚精彩的讨论。同时也预告了下一期《梅斯药说》主题:带量采购背景下的企业破局之路 ,你做好准备了么,欢迎各位持续关注,假期愉快,我们节后见!

上一篇: 《梅斯药说》第五期 “聊聊肿瘤创新药那些...

下一篇: 《梅斯药说》第七期 带量采购背景下的企业...


 本站广告