深度研究发现AI搜索错误率高达60%,且¼的人已抛弃传统搜索

深度研究发现AI搜索错误率高达60%,且¼的人已抛弃传统搜索

原创 AI创业伙伴 AI创业伙伴 2025年03月16日 19:30 广东

当AI搜索引擎变成“自信的谎言家” 

最近,哥伦比亚大学的研究人员给AI搜索工具们安排了一场“摸底考试”,结果发现这些AI聊天机器人,在识别新闻标题、来源和日期时,集体展现出了“学渣”属性。

一、AI学霸集体翻车

在哥伦比亚新闻评论设计的测试中,研究人员从《华尔街日报》《TechCrunch》等20家媒体随机抽取文章,要求AI们完成“小学三年级水平的作业”:说出文章的标题、出版社、日期和网址。结果八位参赛选手平均错误率超过60%。

成绩单亮点:学渣天花板:马斯克的Grok 3以94%错误率勇夺“村里最傻奖”,回答错得比蒙选择题还离谱。

伪学霸代表:ChatGPT搜索版错误率67%,每回答三次就有两次在瞎编。

班级第一:Perplexity AI虽然以63%正确率夺冠,但仍有37%的概率在胡说八道。

更魔幻的是,付费版AI表现更差。Perplexity Pro和Grok 3高级版就像补习班里的“氪金玩家”,钱花得越多,错得越理直气壮。

二、AI的迷惑行为大赏

这些聊天机器人不仅错得多,还错得“创意十足”:

自信爆棚型

明明不知道答案,却像醉酒诗人般即兴创作。当被问及《纽约时报》某篇鲸鱼保护文章时,ChatGPT搜索版直接给用户推送了个抄袭网站链接,堪称“盗版内容搬运工”

张冠李戴型

《奥兰多哨兵报》的读者来信,硬是被AI安在了《时代周刊》头上。这种“乱点鸳鸯谱”的操作,气得原作者想给AI寄律师函。

拒绝认怂型

微软Copilot堪称AI界的“高冷学霸”,面对60%的问题直接甩出“本宫乏了”的冷漠脸,宁可保持沉默,也不愿暴露自己的无知。

三、谁在偷走新闻网站的流量?

传统搜索引擎像尽职的图书馆管理员,总把读者引导到原始资料处。而生成式AI却化身“知识二道贩子”,把信息嚼碎了再吐给用户。这种“中间商赚差价”的模式,直接切断了新闻网站的流量命脉。

流量战争数据:

用户使用AI搜索后,点击外部链接的概率下降40%。

到2026年,传统搜索引擎流量预计缩水25%。

《纽约时报》等大媒体发现,自家内容被AI改头换面后,用户停留时间暴跌50%。

人类的灵魂拷问

当AI搜索工具在40%的情况下引用错误来源,在21%的情况下干脆“空手接白刃”,我们不禁要问:

该相信AI的“自信陈述”,还是自己动手查资料?

当科技公司用“对话体验”包装错误信息时,谁来守护事实真相?

如果AI继续把《华尔街日报》的内容和地摊文学混为一谈,数字时代的“信息巴别塔”会不会轰然倒塌?

这场测试最讽刺的发现或许是:AI们完美继承了人类“不懂装懂”的劣根性。下次当你看到聊天机器人用花哨的排版输出答案时,不妨多问一句:“同学,你确定没抄错作业吗?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

强化学习曾小健

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值