环球视点!ChatGPT通过美放射学委员会考试
【资料图】
加拿大科学家在16日出版的《放射学》杂志上刊登新论文称,最新版本的ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误答案,表明人们仍需对其提供的答案进行核查。
为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性,多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题,这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像,分为低阶(知识回忆、基本理解)和高阶(应用、分析、综合)思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。
研究人员发现,基于GPT-3.5的ChatGPT的正确率为69%,接近70%的及格线。该模型在低阶思维问题上表现相对较好,正确率为84%,但回答高级思维问题时表现不佳,正确率仅为60%。而性能更优异的GPT-4的正确率为81%,且在高阶思维问题上的正确率为81%,远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%,答错了12道题,而GPT-3.5全部答对了这些题目,这引发了研究团队对GPT-4收集信息的可靠性的担忧。
这两项研究都表明,ChatGPT会有提供不正确答案的倾向,如果仅仅依靠它获取信息,非常危险,因为人们可能意识不到其给出的答案是不准确的,这是它目前面临的最大的问题。
相关阅读
精彩推荐
- 环球视点!ChatGPT通过美放射学委员会考试
- 2024湖北公务员考试面试模拟题:“共富经理人”串起乡村“共富链”
- 600015
- 全球焦点!方大特钢(600507):5月17日北向资金减持24.7万股
- 家用燃气泄漏报警器_燃气泄漏报警器|世界看点
- 20个房间将会是春季装修的灵感来源|天天热头条
- dwg格式文件用什么软件打开_img文件怎么打开-天天观点
- 环球今热点:大连市气象局发布雷电黄色预警【III级/较重】【2023-05-17】
- 微速讯:海南移动携手中科云图 推进无人机低空遥感网落地海南城市治理
- 外部高通胀环境尤在 为何中国能够保持温和通胀?
- 百事通!2023给女朋友写的生日祝福语
- 最新快讯!现代汽车欧洲公司CEO:不会针对特斯拉降价直接改变定价
- 每日消息!灵活就业社保中断如何处理?断保的原因有哪些?
- 最新资讯:上海暂停笑果文化在沪全部演出事件简单介绍
- 上海社保最低要交多少钱一个月?上海社保最低缴费基数2023年是多少-天天快播
- 英国脱欧党领导人承认:脱欧是失败的|全球热门
- 免门票、半价游!扬州推出“5·19”文旅惠民套餐 天天消息
- 世界观察:4月份70城房价出炉!62城新房价格环比上涨
- 报道:孟羽童图文广告报价至少15万一条 详细是什么原因?
- 西南证券:给予酒鬼酒买入评级,目标价位133.56元
- 制止餐饮浪费 | 陕西咸阳:多措并举推进专项行动走深走实|环球快报
- 焦点报道:当日快讯:发改委:多措并举扩大新能源汽车消费,推动新能源汽车产业高质量发展
- 分析师称iPhone 15所需面板将在6月份开始生产 与正常年份相当
- 数字经济驱动企业融通发展|当前最新
- 每日快讯!徐娇回应泳装照争议:2023年了,女生穿泳装不正常吗?
- 禾赛美股涨9.61%
- 房产税怎么交视频 房产税怎么交 世界热消息
- 榴莲玉米排骨汤的做法?_世界微速讯
- 振华股份05月16日被沪股通减持14.78万股
- 舌头中间发黑是怎么回事啊_舌苔发黑是怎么回事|热资讯