ChatGPT通过美放射学委员会考试|全球播资讯

来源:科技日报 2023-05-18 14:40:23


(资料图片仅供参考)

科技日报北京5月17日电(记者刘霞)加拿大科学家在16日出版的《放射学》杂志上刊登新论文称,最新版本的ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误答案,表明人们仍需对其提供的答案进行核查。

为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性,多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题,这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像,分为低阶(知识回忆、基本理解)和高阶(应用、分析、综合)思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。

研究人员发现,基于GPT-3.5的ChatGPT的正确率为69%,接近70%的及格线。该模型在低阶思维问题上表现相对较好,正确率为84%,但回答高级思维问题时表现不佳,正确率仅为60%。而性能更优异的GPT-4的正确率为81%,且在高阶思维问题上的正确率为81%,远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%,答错了12道题,而GPT-3.5全部答对了这些题目,这引发了研究团队对GPT-4收集信息的可靠性的担忧。

这两项研究都表明,ChatGPT会有提供不正确答案的倾向,如果仅仅依靠它获取信息,非常危险,因为人们可能意识不到其给出的答案是不准确的,这是它目前面临的最大的问题。

上一篇:40个智慧城市时空大数据平台建成 下一篇:最后一页
精彩推荐

ChatGPT通过美放射学委员会考试|全球播资讯

2023-05-18

40个智慧城市时空大数据平台建成

2023-05-18

通讯!9大美媒预测火箭4号签选A汤!美记称哈登回归也选他:波特或遭弃

2023-05-18

世界观天下!青岛综合立体交通产业示范园项目落地! 一园多区,联动发展!

2023-05-18

【独家】锦富5.03亿元竞得江门蓬江滨江新区商住地 楼面价4600元/平米

2023-05-18

全球新消息丨注意!最新停电信息

2023-05-18

俄罗斯老米乐啤酒为何这么受欢迎?

2023-05-18

前沿热点:上海:牵住解决民营企业融资难融资贵“牛鼻子”截至一季度末民营小微企业贷款平均利率已降至3.99%的历史最低水平

2023-05-18

国机汽车05月17日被沪股通减持18.29万股

2023-05-18

联合国秘书长欢迎黑海港口农产品外运协议再延长两个月-当前观察

2023-05-18

记者观察丨阿盟峰会筹备会议进行 多国欢迎叙利亚

2023-05-18

单位pcs是什么意思_pcs是什么意思-全球头条

2023-05-18

华力创通:公司已经研制适用于机载和车载领域相应产品

2023-05-17

电影《告密者》举行特别放映活动,西德妮·斯威尼透视装吸睛 快看点

2023-05-17

全国总工会:到2025年底全国工会每年组织劳模、职工休疗养达500万人次

2023-05-17

家用开水壶能煮鸡蛋吗-当前独家

2023-05-17

新光药业主要股东和丰投资累计减持96.41万股 减持时间已过半_焦点热门

2023-05-17

中国钢铁工业协会总经济师王颖生一行到访上海钢联

2023-05-17

当前资讯!广州港澳通行证团队旅游签注首次办理需要预约吗?

2023-05-17

5月17日 14:19分 辉丰股份(002496)股价快速拉升

2023-05-17
相关推荐

ChatGPT通过美放射学委员会考试|全球播资讯

2023-05-18

40个智慧城市时空大数据平台建成

2023-05-18

通讯!9大美媒预测火箭4号签选A汤!美记称哈登回归也选他:波特或遭弃

2023-05-18

世界观天下!青岛综合立体交通产业示范园项目落地! 一园多区,联动发展!

2023-05-18

【独家】锦富5.03亿元竞得江门蓬江滨江新区商住地 楼面价4600元/平米

2023-05-18

全球新消息丨注意!最新停电信息

2023-05-18

俄罗斯老米乐啤酒为何这么受欢迎?

2023-05-18

前沿热点:上海:牵住解决民营企业融资难融资贵“牛鼻子”截至一季度末民营小微企业贷款平均利率已降至3.99%的历史最低水平

2023-05-18

国机汽车05月17日被沪股通减持18.29万股

2023-05-18

联合国秘书长欢迎黑海港口农产品外运协议再延长两个月-当前观察

2023-05-18