首页 > 活动线报 > 每日福利 > 如何减少AI“一本正经地胡诌”?新方法出现了

如何减少AI“一本正经地胡诌”?新方法出现了

发布时间:2024-06-25 16:51:54来源: 15210273549

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

每日福利更多>>

极致续航补能+高阶智驾再远也无忧,春节自驾归家首选昊铂HT 大溜背C级车,轴距超2.9m,配置升级,增程/纯电可选,13.46万起 全新一代丰田荣放谍照曝光,延续家用定位,有消息称取消燃油版 开年就摘得周销冠,吉利银河星舰7都做对了什么 30万就能买宝马i5,为什么还要看更贵的腾势Z9? 欧洲汽车行业进一步滑向凛冬 开了几十款新车的肺腑之言:买新能源车,这3个“底线”不能破 2024年度盘点:活得好的不止比亚迪 雷军官宣:小米汽车工厂开放参观,名额有限,你准备好了吗? 2024汽车销量榜单出炉,比亚迪特斯拉等谁领风骚? 年销217万辆达历史新高,内卷之下吉利增长的奥秘是什么? 上市造车新势力:2024连破纪录,2025不再激进? 2025年三款新能源SUV来袭,智能颜值双在线,你准备好了吗? 智驾“新基建”浪潮:IP、EDA与云计算三件套,走向刚需 年销量破200万辆!广汽集团去年连续6个月环比增长 小米汽车工厂开放参观预约,雷军:每周六限20组,你准备好了吗? 首发华为四大黑科技,售24.98-28.98万元,智界R7增程版上市 限时售价13.59-15.09万元,适合年轻消费群体的领克Z20 拳打理想L6脚踢问界M7 有了增程的智界R7月销要稳定破万! 技术与设计双突破,蔚来ET9自研创新,引领智能行政出行新时代 江淮瑞风RF8 PHEV鸿蒙版:华为智慧屏+强劲混动,驾驶体验全面升级 15万级“性价比黑马”来了,“金标大众”配置拉满 2025款MG7上市,MG要如何反弹? 全球第三大车企将诞生,但其目标或很难实现 2024年海南定安县公安局招聘辅警25人公告 2024年湖南长沙市委金融委员会办公室招聘中级雇员公告 2025年湖南岳阳市中心医院招聘公告 2024年湖南邵阳市公路建设养护中心所属公益一类事业单位选调文秘工作人员公告 2024年湖南浏阳市招聘卫健系统专业人才15人公告 2025年辽宁朝阳市教育局直属学校赴高校招聘教师70人公告