深度研究发现AI搜索错误率高达60%，且¼的人已抛弃传统搜索

强化学习曾小健

于 2025-03-16 23:29:13 发布

阅读量675

点赞数 18

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_37574187/article/details/146303836

版权

深度研究发现AI搜索错误率高达60%，且¼的人已抛弃传统搜索

原创 AI创业伙伴 AI创业伙伴 2025年03月16日 19:30 广东

当AI搜索引擎变成“自信的谎言家”

最近，哥伦比亚大学的研究人员给AI搜索工具们安排了一场“摸底考试”，结果发现这些AI聊天机器人，在识别新闻标题、来源和日期时，集体展现出了“学渣”属性。

一、AI学霸集体翻车

在哥伦比亚新闻评论设计的测试中，研究人员从《华尔街日报》《TechCrunch》等20家媒体随机抽取文章，要求AI们完成“小学三年级水平的作业”：说出文章的标题、出版社、日期和网址。结果八位参赛选手平均错误率超过60%。

成绩单亮点：学渣天花板：马斯克的Grok 3以94%错误率勇夺“村里最傻奖”，回答错得比蒙选择题还离谱。

伪学霸代表：ChatGPT搜索版错误率67%，每回答三次就有两次在瞎编。

班级第一：Perplexity AI虽然以63%正确率夺冠，但仍有37%的概率在胡说八道。

更魔幻的是，付费版AI表现更差。Perplexity Pro和Grok 3高级版就像补习班里的“氪金玩家”，钱花得越多，错得越理直气壮。

二、AI的迷惑行为大赏

这些聊天机器人不仅错得多，还错得“创意十足”：

自信爆棚型

明明不知道答案，却像醉酒诗人般即兴创作。当被问及《纽约时报》某篇鲸鱼保护文章时，ChatGPT搜索版直接给用户推送了个抄袭网站链接，堪称“盗版内容搬运工”

张冠李戴型

《奥兰多哨兵报》的读者来信，硬是被AI安在了《时代周刊》头上。这种“乱点鸳鸯谱”的操作，气得原作者想给AI寄律师函。

拒绝认怂型

微软Copilot堪称AI界的“高冷学霸”，面对60%的问题直接甩出“本宫乏了”的冷漠脸，宁可保持沉默，也不愿暴露自己的无知。

三、谁在偷走新闻网站的流量？

传统搜索引擎像尽职的图书馆管理员，总把读者引导到原始资料处。而生成式AI却化身“知识二道贩子”，把信息嚼碎了再吐给用户。这种“中间商赚差价”的模式，直接切断了新闻网站的流量命脉。

流量战争数据：

用户使用AI搜索后，点击外部链接的概率下降40%。

到2026年，传统搜索引擎流量预计缩水25%。

《纽约时报》等大媒体发现，自家内容被AI改头换面后，用户停留时间暴跌50%。

人类的灵魂拷问

当AI搜索工具在40%的情况下引用错误来源，在21%的情况下干脆“空手接白刃”，我们不禁要问：

该相信AI的“自信陈述”，还是自己动手查资料？

当科技公司用“对话体验”包装错误信息时，谁来守护事实真相？

如果AI继续把《华尔街日报》的内容和地摊文学混为一谈，数字时代的“信息巴别塔”会不会轰然倒塌？

这场测试最讽刺的发现或许是：AI们完美继承了人类“不懂装懂”的劣根性。下次当你看到聊天机器人用花哨的排版输出答案时，不妨多问一句：“同学，你确定没抄错作业吗？

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

强化学习曾小健 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。