送给扎心的你,大型AI硬刚现场 | 315晚会AI预测最终胜出者评比

昨天的预测在这里:

四大 AI 联合打造 315 晚会曝光清单,这些信息不容错过!

315晚会已经徐徐落幕,屏幕前的你是不是也在两个半小时内在屏幕前被反复扎心呢。昨天我们的AI预测是不是准确呢,我们现在就来揭晓。

今天的评比讲究一个用事实说话,直接硬刚。传统的检查需要自己去去表格中一个一个比对,今天就让AI工具自己给自己打个分。考验一下他们的信息采集能力和理解能力。

AI工具的历史对话功能

这里先要介绍一下AI工具的历史对话功能。很多人每次查询都是从入口页进入,每次都打开一个全新的对话。其实AI在理解你的问题的时候需要参考之前对话。而我们如果想问一个与之前问答相关的问题的时候就需要使用之前的历史对话继续问下去。

以deepseek为例,可以在右边的工具栏找到之前的对话记录。点击就可以继续之前的对话。

图片

让AI自己给自己打分

这次打分安排在早晨,可以让网络上关于315的晚会的内容更加详细一些,给予AI工具一个比较好的可用素材。

提示语:

315晚会结束了,昨天让你预测了10个最可能被曝光的事件。今天晚会已经结束了。请结合昨天曝光的内容清单,说说看自己有没有预测中,并给自己的预测打个分。

Deepseek (3/10)

通过推理过程可以看到deepseek对指令的理解还是很充分的,曝光事件抓取的也很准确。

图片

在获取了足够的依据之后,AI会对是否猜中进行分析。“猜中”并不是逐字的比对,AI在这里做了许多的分析,包含了总结归纳的过程,看起来还是很有道理的。

图片

最后的结果:
打分项绿色框中的是命中的,红色框中的解释的有些牵强。最后差不多3/10的命中率。deepseek的亮点是分析的比较到位,并且还能自己总结自己的优缺点。是个好的报告。

图片

Kimi(2/10)

图片

刚开始kimi好像并没有完全理解我的意思。于是再加了点提示。

通过搜索网络先找到昨天曝光的事件,并与昨天的预测进行比较。

这回AI终于搞清楚我的问题了,应该说事件读取挺准确的。自评也没问题,不过为什么只命中两个就给自己打了60分。呵呵,是个情商挺高的文科生。体制内的牛马考虑多用用。

图片

最后的结果:
2/10

豆包 (3/10)

可能昨天并没有登录,所以关于预测的历史记录找不到了。重新预测流程会被昨天晚会结果干扰,所以豆包就不做自评了。翻看昨天的内容,差不多3/10,还是挺准确的.

图片

阿里通义 (2/10)

通义的输出很干脆,但是看到昨天晚会曝光的内容这里感觉有点问题,后面几条好像并没有看到啊,还好后面有来源的追溯。我们找一个充电桩的来源看一下。

图片

点击4,就能在右边显示来源,下面还有网址。继续点击打开。

图片

难道我看了假的315晚会? 看起来这个文章也是AI生成的,夹杂着许多的广告。这个问题是AI将来会面临的最大的问题,“是否能分辨真假信息源”。别有用心的人可以通过不断在网络上发布假消息来干扰AI生成的结果。到明年315大量应用AI应该有一年时间,也许这个问题会在明年的315上曝光(我的预测)

图片

再回到结果上来,因为使用了完全不准确的消息源,所以这个结果也完全不能让人信服。我为苹果的用户捏一把汗。实际的命中了2和10,差不多2/10

总结

AI模型

Deepseek

kimi

豆包

通义

1

预制菜行业:食材安全与卫生乱象

食品安全问题

预制菜 “隐秘角落”

AI技术滥用与数据安全

2

新能源汽车:电池安全与续航虚标

保健品虚假宣传

奶茶与餐饮后厨乱象

预制菜产业链隐患

3

AI与数据安全:隐私泄露与深度伪造诈骗

汽车质量问题

“高端食品” 虚假宣传

新能源汽车服务乱象

4

直播电商:虚假宣传与售后陷阱

互联网金融风险

新能源汽车与智能出行隐患

直播电商新型套路

5

医美行业:无证行医与“黑科技”陷阱

化妆品质量问题

人工智能与数据服务侵权

医疗美容灰色地带

6

金融消费:网贷隐性收费与虚拟货币骗局

快递服务乱象

网贷平台 “套路贷” 新变种

儿童用品安全升级

7

智能家居:数据泄露与产品安全隐患

教育培训陷阱

直播电商 “套路营销”

农村市场下沉漏洞

8

电动自行车:锂电池火灾隐患

智能设备安全漏洞

宠物食品 “毒粮” 事件

碳中和概念滥用

9

儿童用品:毒文具与激光玩具安全

旅游行业乱象

医美机构 “黑针会”

银发经济陷阱

10

翻新手机产业链:以次充好流入市场

宠物食品质量问题

“幽灵” 外卖作坊

互联网金融风险

预测准确率

3/10

2/10

3/10

2/10

总结

六边形王者

文科甩锅王

默默无闻干活的

幻觉大师

好了,看完了硬刚现场,可以看出deepseek火出圈甚至让米国股市颤抖是很有道理的。其他的大模型也各有千秋,综合实力上还是需要继续打磨。

历史文章检索:

文档系列

【免费下载】小朋友再不学AI就来不及啦 | “少年商学院|DeepSeek中小学生使用手册(83页)”

[免费下载]浙江大学DeepSeek系列公开课:智能时代的全面到来和人机协作的新常态(含视频课

这一回不要羡慕别人了,快来取 |  北京大学:DeepSeek与AIGC应用

办公&图文创作

别再用KimiPPT助手了 | 比较了三个AI工具后大师兄给牛马的忠告

大师兄登录小红书 |  跟着大师兄学 AI 图文笔记,小红书创作不求人

抢救褪色记忆!手残党福利,AI三步修复老照片

三八妇女节海报设计0成本!用AI工具2步生成精美海报?0基础也能秒懂

体制人必看:DeepSeek智能改稿的3大禁忌与3个提效密码

特朗普VS泽连斯基刷屏 | 别被碎片化信息骗了!这才是AI分析特朗普事件的正确姿势

DeepSeek:选对模型,效率翻倍。   送Deepseek清华AI 5件套

AI编程与系统

20年经验程序员被AI踢馆现场!AI时代职场危机应对

大师兄数字生命崛起 | 腾讯元器五分钟零成本集成”公众号文章问答“

AI五分钟科普

5分钟!| 早读课偷偷哼歌被表扬!这招让<出师表>秒变洗脑神曲无需安装!5 分钟体验 AI 文生图魔法(内有豆包安装方法)

AI新闻

四大 AI 联合打造 315 晚会曝光清单,这些信息不容错过!

英特尔首次换上华人CEO | AI你怎么看

特朗普VS泽连斯基刷屏 | 别被碎片化信息骗了!这才是AI分析特朗普事件的正确姿势

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值