|

聚财星
2000活跃值=1元

首页 > 生活分享 > 免费教学 > 比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

发布时间：2024-03-30 21:52:16来源： 15210273549

大模型的幻觉问题怎么解？谷歌DeepMind：用AI来做同行评审！事实核验正确率超过人类，而且便宜20倍。

AI的同行评审来了！

一直以来，大语言模型胡说八道（幻觉）的问题最让人头疼，而近日，来自谷歌DeepMind的一项研究引发网友热议：

大模型的幻觉问题，好像被终结了？

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

论文地址：https://arxiv.org/pdf/2403.18802.pdf

项目地址：https://github.com/google-deepmind/long-form-factuality

在这篇工作中，研究人员介绍了一种名为 "搜索增强事实性评估器"（Search-Augmented Factuality Evaluator，SAFE）的方法。

对于LLM的长篇回答，SAFE使用其他的LLM，将答案文本分解为单个叙述，然后使用诸如RAG等方法，来确定每个叙述的准确性。

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

——简单来说就是：AI答题，AI判卷，AI告诉AI你这里说的不对。

真正的「同行」评审。

另外，研究还发现，相比于人工标注和判断事实准确性，使用AI不但便宜20倍，而且还更靠谱！

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

目前这个项目已在GitHub上开源。

长文本事实性检验

大语言模型经常胡说八道，尤其是有关开放式的提问、以及生成较长的回答时。

比如小编随手测试一下当前最流行的几个大模型。

ChatGPT：虽然我的知识储备只到2021年9月，但我敢于毫不犹豫地回答任何问题。

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

Claude 3：我可以谦卑且胡说八道。

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

为了对大模型的长篇回答进行事实性评估和基准测试，研究人员首先使用GPT-4生成LongFact，这是一个包含数千个问题的提示集，涵盖38个主题。

LongFact包含两个任务：LongFact-Concepts和LongFact-Objects，前者针对概念、后者针对实体。每个包括30个提示，每个任务各有1140个提示。

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

然后，使用搜索增强事实性评估器（SAFE），利用LLM将长篇回复分解为一组单独的事实，并使用多步骤推理过程来评估每个事实的准确性，包括使用网络搜索来检验。

此外，作者建议将F1分数进行扩展，提出了一种兼顾精度和召回率的聚合指标。

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

SAFE工作流程

比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“聚财星用户上传并发布"，本平台仅提供信息存储服务。

下一篇:谷歌Pixel Watch 3智能手表曝光，配307mAh容量电池

上一篇:比人类便宜20倍！谷歌DeepMind推出“超人”AI系统

免费教学更多>>

苹果：为什么我突然在中国对iPhone 16等降价！华为等国产手机背刺 2500元良心机！骁龙8Gen3+5500mAh+120W，vivo新卷王诞生 REDMI Turbo 4海外版曝光：电池降为6000mAh！从4699元跌至3289元，蔡司100倍变焦+天玑9300+芯片，vivo售价更亲民了雷鸟CEO李宏伟：站在Meta肩膀上超越Meta，雷鸟V3 1799元起 Meta、苹果旗舰头显纷纷停产！价格与体验失衡是最大硬伤？ 2024年中国手机市场大局已定几家欢喜几家愁？英伟达RTX 50系新显卡发布！AI计算又翻开了崭新一页？那些科学家下了大功夫的美食，拼多多希望让更多人吃到京东科技申请服务器自动化测试方法和装置专利，实现大规模服务器自动化测试阿里巴巴：斥资3226.13万美元回购306.53万股经典与潮流并存！27款最具影响力车型回顾，你拥有过哪一款？负债不够存单来凑，年内多家银行同业存单罕见“提额” 菜鸟速递与大润发加深同城配送合作已在41城提供半日达服务社会物流成本稳步下降，实体经济“筋络”更加畅通 589套正式交楼，广州一村村民喜提新房过年明年如何“用力”推动楼市止跌回稳？全国住建工作会议部署了这些重点多方共议房产直播规范监管共促消费者权益保护东风本田烨S7实车展示，Model Y同级别，够实力和自主品牌一战吗？ 2024年广西工业职业技术学院轻工纺织类人才引进公告 2024年湖北宜昌市西陵区事业单位选调14人公告四川凉山普格县委政法委员会招聘专职网格员7人公告四川凉山普格县退役军人事务局招聘临聘人员公告云南玉溪砚山县蚌峨乡人民政府招聘公益性岗位人员公告云南西双版纳州民族宗教事务局公益性岗位招聘公告 2025年河北唐山市路北区赴高校选聘55名教师公告 2024年河南濮阳县事业单位招聘115人公告 2024年吉林通化市辉南县教育系统招聘急需紧缺专业教师5人公告 2024年河北廊坊燕京职业技术学院选聘专任教师17人公告 2024年河北廊坊燕京职业技术学院招聘教辅人员7人公告

Copyright 2016-2025 点我98任务网版权所有京ICP备20162561号