ASJ:人工智能和大型语言模型的医学应用

时间:2023-12-05 09:34:17   热度:37.1℃   作者:网络

人工智能(AI)的潜在医学应用正在科学文献中引起广泛关注,仅ChatGPT就发表了多达222篇论文,ChatGPT等大型语言模型以文本的形式解释、合成和输出信息。 OpenAI于2022年11月发布的ChatGPT席卷全球,彻底改变了医生与AI技术的交互方式。

Aesthetic Surgery Journal最新的一篇文章,作者回顾了描述ChatGPT准确性、可靠性和安全性的现有文献。

124种不同期刊报道了ChatGPT医学应用的文献。ChatGPT相关文献发文量最多的是Cureus (21.2%;n = 47), Annals of Biomedical Engineering (3.6%;n = 8)、Aesthetic Surgery Journal (2.7%;n = 6)。文献来源于34个国家,发文量最高的是美国(41.4%;n = 92),中国(9.5%;n = 21)、印度(6.3%;n = 14)。在撰写本文时,这些研究被引用了1354次,平均每篇文献被引用6.1次(范围,0 ~ 224)。ChatGPT文献平均月被引513.2次,平均每篇文献月被引2.4次。这些令人印象深刻的文献计量,在该技术发布短短6个月内就积累起来,并不一定与可靠性相关。

222篇文献中,62篇(27.9%)报告了ChatGPT的假设应用,主要是以给编辑的信形式发表。尽管这些文章引发了讨论,但大多数缺乏证据和科学严谨性。222篇文献中的121篇(54.5%)报告了已证实的应用,其中57篇(47.1%)既缺乏验证也缺乏ChatGPT性能评估,因此仅代表“概念验证”。只有在人工智能的性能准确性、可靠性和安全性得到证实后,提出的医疗应用才会有用。在纳入了某种形式的绩效评估的64项研究(52.9%)中,大多数评估是主观的(34/ 64,53.1%),只有30项(46.9%)使用了客观的验证技术。另外39篇(17.6%)是在ChatGPT辅助下撰写的病例报告,不适用于医疗实践。222篇文章中只有30篇(13.5%)提出、实施并客观评估了ChatGPT在潜在医疗应用中的性能,其余86.5%的文献几乎没有科学价值。目前,这一新兴领域低于科学出版标准,但每月有513.2次引用,因此人们对这一主题的信息有强烈的兴趣。关于理论应用的评论和给编辑的信是发展思想的灵感,但不构成证据。

综上, AI在医学领域应用的假设需要被验证。只有这样,AI在医学领域的应用才能符合必要的安全法规,并取得实质性进展。

原始出处:

Abi-Rafeh J, Xu HH, Kazan R, Furnas HJ. Medical Applications of Artificial Intelligence and Large Language Models: Bibliometric Analysis and Stern Call for Improved Publishing Practices. Aesthet Surg J. 2023;43(12):NP1098-NP1100. doi:10.1093/asj/sjad277

上一篇: 病理干货 | 简述子宫内膜癌的分子分型及...

下一篇: PATHOLOGY:通过快速评估获得的细...


 本站广告