哥伦比亚:​研究显示 60% 以上 AI 聊天机器人回答错误 新闻可信度遭受挑战

根据哥伦比亚新闻评论的数字新闻中心最新研究流行的 AI 搜索工具在回答问题时超过60% 的概率提供了不正确或误导性的信息。这一结果令人担忧,因为这些工具不仅削弱了公众对新闻报道的信任,也使出版商面临流量和收入的双重损失。

研究人员测试了包括 ChatGPT、Perplexity、Gemini 和 Grok 在内的八款生成式 AI 聊天机器人,要求它们识别来自200篇最新新闻文章的摘录。结果显示,超过60% 的回答都是错误的,这些聊天机器人经常捏造标题、不引用文章或引用未经授权的内容。即使它们能正确指出发布者,链接也常常指向失效的 URL、转载版本或与内容无关的页面。

令人失望的是,这些聊天机器人很少表达不确定性,反而以不当的自信提供错误的答案。例如,ChatGPT 在200个查询中提供了134条错误信息,但仅在15次中表示过怀疑。即便是付费版的 Perplexity Pro 和 Grok3,其表现也不尽如人意,错误答案的数量更高,尽管它们的价格分别为每月20美元和40美元。

在内容引用方面,多个聊天机器人未能遵循出版商的限制尝试,五款聊天机器人甚至忽视了机器人排除协议这一被广泛接受的标准。Perplexity 就曾在出版商限制其爬虫的情况下,正确引用国家地理的文章。与此同时,ChatGPT 通过未授权的 Yahoo 新闻重新引用了收费墙内容的 USA Today 文章。

此外,很多聊天机器人将用户引导至 AOL 或 Yahoo 等平台的转载文章,而非原始来源,甚至在已经与 AI 公司达成授权协议的情况下。例如,Perplexity Pro 引用了德克萨斯论坛的转载版本,却未能给出应有的署名。而 Grok3和 Gemini 则常常发明 URL,Grok3的200个回答中有154个链接至错误页面。

这一研究突显了新闻机构面临的日益严重危机。越来越多的美国人将 AI 工具作为信息来源,但与 Google 不同,聊天机器人不会将流量引向网站,反而会在没有链接回去的情况下总结内容,从而使出版商失去广告收入。新闻媒体联盟的丹妮尔・科菲警告称,如果没有对爬虫的控制,出版商将无法有效 “变现有价值的内容,或支付记者的薪水”。

研究小组在联系 OpenAI 和微软后,他们虽然对自己的做法进行了辩护,但并未回应具体的研究发现。OpenAI 表示,它 “尊重出版商的偏好”,并帮助用户 “发现优质内容”,而微软则声称其遵循 “robots.txt” 协议。研究人员强调,错误的引用做法是系统性的问题,而非个别工具的现象。他们呼吁 AI 公司改善透明度、准确性以及对出版商权益的尊重。

自  AIbase基地

欢迎您加入199IT知识星球,感谢您支持我们的发展。

1、用微信扫描左侧二维码;
2、知识星球主要以数据研究、报告分享、数据工具讨论为主;
3、加入后免费提问、免费阅读1.5万个相关数据内容,并同步海外优质数据文档;
4、每年只需199元,老用户可九折续费。

欢 迎 关 注 微 信 号 :i199IT

扫描微信二维码,数据随身查
扫描左侧二维码或搜索添加微信公众号:i199IT
TMT最全的数据微信平台,随时随地获知有价值的数据信息

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。