首页 > 活动线报 > 每日福利 > 如何减少AI“一本正经地胡诌”?新方法出现了

如何减少AI“一本正经地胡诌”?新方法出现了

发布时间:2024-06-25 16:51:54

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

每日福利更多>>

北京市首个6G产业专项政策发布,计划2030年突破核心技术50项以上 地球在变暖,这群人却用冰做“硬盘” 奇骏荣耀定价11.98万元起,日产是在打价格战吗? 上汽奥迪A5L预售价公布 价格诱人配置还超出想象? 中兴1949:重载不降速,效率与实力的全能担当 智驾新标杆,小鹏G7震撼上市,重塑20万级SUV市场格局! 1-5月全球电池累计装车量:宁德时代152.7GWh、比亚迪70GWh…… 比亚迪纯电重卡Q3在上海虹口北外滩开启试运营 小米“车规级纸巾盒”可能是一片蓝海 比亚迪海豹06DM-i旅行版上市,10.98万起开创全民新旅时代 One UI 8动画文件揭秘三星三折叠手机:采用双内折设计 限时40.39万元起 Jeep牧马人/角斗士侏罗纪世界探索版上市 6月主流车企销量:比亚迪一哥,零跑新势力一哥,小米或未来一哥! 价格有惊喜还增配了 2026款起亚赛图斯限时售7.79万起 小米YU7爆卖,特斯拉涨价? 启辰放大招!2026款启辰大V 6.98万起焕新,好省好开好看全拿下 乐道L90内饰图解读,内饰温馨三排配置有惊喜! 方程豹6月销量近1.9万辆创新高:钛3破万重塑纯电格局,豹5蝉联硬派越野冠军 删掉了“星纪”二字,恢复“魅族科技”,微信公众号悄然改名 理想架构再度调整,汽车、AI协同共进 新车市场探访,没有了高息高返,油车也得卖啊 全新宝马M3纯电动版内饰谍照曝光!于27年3月份正式推出 欧拉好猫2025款上市!设计焕新+配置下放 家用B级车该怎么选?蒙迪欧VS雅阁,看完对比你就明白了! 如何将一加手机备份到电脑?2024年5种安全方法 5月各省汽车销冠品牌榜:比亚迪彻底封神 霸榜27省 扎克伯格为AI斥重金“招兵买马”,消息称Meta再挖角OpenAI四名研究员 硅谷华人AI大牛被疯狂挖角!小扎打包带走4名OpenAI研究员 微软称Win11电脑比Win10电脑快2.3倍引争议:实为新旧硬件对比 韦尔股份更名豪威集团后,向香港联交所递交上市申请