新闻|人工智能2023年5月19日|

研究突出了大型语言模型在放射学的增长潜力

研究突出了大型语言模型在放射学的增长潜力

2023年5月19日-最新版本的吗ChatGPT通过放射式考试,强调大型语言模型的潜力但也暴露的局限性,阻碍可靠性,根据两个新的研究发表在放射学的杂志北美放射学会(RSNA)。

ChatGPT是一个人工智能(AI)聊天机器人使用深度学习模型来识别模式和词汇之间的关系在其庞大的训练数据来生成基于一个提示类似人类的反应。但是因为没有真理的训练数据的来源,这个工具可以生成响应与事实不符的。

“大型语言模型的使用像ChatGPT爆炸只会增加,”作者说Rajesh Bhayana,医学博士,FRCPC,一个腹部放射学家和技术领先多伦多大学医学成像在加拿大多伦多,多伦多综合医院。“我们的研究提供了洞察ChatGPT性能在放射学背景,突出大型语言模型的令人难以置信的潜力,以及当前的局限性,使其不可靠。”

ChatGPT最近历史上增长最快的消费应用程序命名,和类似的聊天机器人被纳入流行的搜索引擎像谷歌和必应,医生和病人使用寻找医疗信息,Bhayana博士指出。

放射学委员会考试来评估它的性能问题和探索的优势和局限性,Bhayana博士和他的同事们第一次测试ChatGPT基于gpt - 3.5,目前最常用的版本。研究人员使用了150多项选择题问题设计风格与内容和困难的加拿大皇家学院美国放射学委员会考试。

的问题不包括图像和被问题类型分组来洞察性能:低阶(回忆知识,基本了解)和高阶(应用、分析、综合)的思考。高阶思维问题是进一步subclassified类型(描述影像学表现、临床管理、计算和分类、疾病协会)。

ChatGPT是评估整体的性能和问题类型和主题。语言反应的信心也被评估。

研究人员发现ChatGPT基于gpt - 3.5回答问题正确(104 150)的69%,接近70%的及格分数由加拿大皇家学院使用。模型要求低阶思维问题表现相对较好(61)84%,51,但是纠结的问题涉及高阶思维(89年60%,53)。更具体地说,它在高阶问题涉及的描述成像结果(61%,28 46),计算和分类(8)25%,2,和应用程序的概念(30%,3 10)。对高阶思维的表现不佳的问题缺乏并不令人惊讶radiology-specific pretraining。

GPT-4发布2023年3月在有限的形式支付用户,特别是声称对gpt - 3.5改进先进的推理能力。

在后续研究中,GPT-4回答81%(121 150)同样的问题正确,优于gpt - 3.5,超过阈值的70%。GPT-4执行比gpt - 3.5(81%)高阶思维问题,更具体地说涉及的描述影像学表现(85%)和应用程序的概念(90%)。

研究结果表明GPT-4声称改善了先进的推理能力转化为在放射学背景下增强性能。他们还建议改善上下文的理解radiology-specific术语,包括成像描述,使未来的下游应用程序的关键。

“我们的研究表明一个令人印象深刻的改善性能的ChatGPT放射学在短时间内突出的增长潜力大的语言模型在这种背景下,“Bhayana博士说。

GPT-4没有改善低阶思维问题(80% vs 84%),回答12错误gpt - 3.5回答正确,提高其可靠性信息收集相关的问题。

“我们最初惊讶ChatGPT准确、自信的放射学一些具有挑战性的问题的答案,然后同样惊讶的一些非常不合逻辑的和不准确的断言,“Bhayana博士说。“当然,鉴于这些模型是如何工作的,不准确的反应不应该特别令人惊讶。”

ChatGPT危险的倾向产生不准确的反应,称为幻觉,在GPT-4那么频繁,但仍然限制可用性目前在医学教育和实践。

这两项研究表明,ChatGPT使用一贯自信的语言,即使不正确的。这是特别危险的,如果仅仅依赖于信息,Bhayana博士指出,特别对新手来说,可能不承认相信错误的反应是不准确的。

“对我来说,这是它的最大限制。目前,ChatGPT最好用于火花的想法,帮助启动医学写作过程和数据汇总。如果用于快速召回信息,它总是需要核查事实,“Bhayana博士说。

更多信息:www.rsna.org


相关内容

放射学领导研究所宣布2023领导奖
新闻|ACR

2023年5月19日—领导放射学研究所(扶轮领导学院(RLI))名叫诺曼·j·波Jr .),医学博士,肉类,FACR,陆军研究实验室的小货车摩尔…

时间2023年5月19日,
箭头
无症状的成年人高积累的脂肪在肌肉处于重大不良事件和死亡的风险增加
新闻|放射成像

2023年5月19日—成人无症状的高积累的脂肪在肌肉中,称为myosteatosis,正处于……

时间2023年5月19日,
箭头
新3500年飞利浦CT增加投资回报会议常规放射学和大容量的吞吐量和正常运行时间需要筛选程序
新闻|计算机断层扫描(CT)

2023年5月18日,皇家飞利浦全球领先的医疗技术,宣布启动3500年飞利浦CT,一个新的…

时间2023年5月18日
箭头
Carestream健康的新通用DRX-LC探测器旨在改善病人的舒适,图像质量和诊断信心,和生产力的长度在骨科图像捕获。
新闻|数字放射显影术(博士)

2023年5月18日—Carestream健康的新通用DRX-LC探测器旨在改善病人的舒适,图像质量……

时间2023年5月18日
箭头
Paige癌症故障诊断公司宣布了新的先进的集成功能Paige平台,全面的网络解决方案为人工智能,使建造完成数字病理工作流和支持现代实验室的发展需求。
新闻|数字病理

2023年5月18日-佩奇,全球提供端到端的数字病理解决方案和临床人工智能…

时间2023年5月18日
箭头
软件使得在家工作的放射科医生选择非紧急扫描他们读和报告可以延长周转时间较低优先级的图像,根据最新的西弗吉尼亚大学的研究。这些延迟防止医院床位清理和重新分配,增加医院成本和病人的不满。
新闻|世界杯2022赛程时间表最新

2023年5月17日—在线工作流系统离线放射科医生是医疗保险的一个原因延误,成本…

时间2023年5月17日
箭头
MinXray的全球销售总监迈克Cairnie
新闻|数字放射显影术(博士)

2023年5月17日,经过近一年的官方审核,全球销售总监迈克Cairnie MinXray……

时间2023年5月17日
箭头
视频|沙特vs阿联酋比分预测

HIMMS正在努力带来的经验知识和证据价值和影响的数字成熟度测量HIMSS……

时间2023年5月17日
箭头
莫妮卡Bertagnolli博士
新闻|放射肿瘤学

2023年5月16日,美国放射肿瘤学协会(ASTRO)今天表示强烈支持总统……

时间2023年5月16日
箭头
新闻|2022世界杯篮球预选赛赛程

2023年5月15日—RSNA更新其声明筛查乳腺癌,识别新建议的……

时间2023年5月15日
箭头
现在就订阅