送给扎心的你，大型AI硬刚现场 | 315晚会AI预测最终胜出者评比-CSDN博客

本文链接：https://blog.csdn.net/u014527622/article/details/146292111

昨天的预测在这里：

四大 AI 联合打造 315 晚会曝光清单，这些信息不容错过！

315晚会已经徐徐落幕，屏幕前的你是不是也在两个半小时内在屏幕前被反复扎心呢。昨天我们的AI预测是不是准确呢，我们现在就来揭晓。

今天的评比讲究一个用事实说话，直接硬刚。传统的检查需要自己去去表格中一个一个比对，今天就让AI工具自己给自己打个分。考验一下他们的信息采集能力和理解能力。

AI工具的历史对话功能

这里先要介绍一下AI工具的历史对话功能。很多人每次查询都是从入口页进入，每次都打开一个全新的对话。其实AI在理解你的问题的时候需要参考之前对话。而我们如果想问一个与之前问答相关的问题的时候就需要使用之前的历史对话继续问下去。

以deepseek为例，可以在右边的工具栏找到之前的对话记录。点击就可以继续之前的对话。

让AI自己给自己打分

这次打分安排在早晨，可以让网络上关于315的晚会的内容更加详细一些，给予AI工具一个比较好的可用素材。

提示语：

★
315晚会结束了，昨天让你预测了10个最可能被曝光的事件。今天晚会已经结束了。请结合昨天曝光的内容清单，说说看自己有没有预测中，并给自己的预测打个分。

Deepseek （3/10）

通过推理过程可以看到deepseek对指令的理解还是很充分的，曝光事件抓取的也很准确。

在获取了足够的依据之后，AI会对是否猜中进行分析。“猜中”并不是逐字的比对，AI在这里做了许多的分析，包含了总结归纳的过程，看起来还是很有道理的。

最后的结果：
打分项绿色框中的是命中的，红色框中的解释的有些牵强。最后差不多3/10的命中率。deepseek的亮点是分析的比较到位，并且还能自己总结自己的优缺点。是个好的报告。

Kimi（2/10）

刚开始kimi好像并没有完全理解我的意思。于是再加了点提示。

★
通过搜索网络先找到昨天曝光的事件，并与昨天的预测进行比较。

这回AI终于搞清楚我的问题了，应该说事件读取挺准确的。自评也没问题，不过为什么只命中两个就给自己打了60分。呵呵，是个情商挺高的文科生。体制内的牛马考虑多用用。

最后的结果：
2/10

豆包（3/10）

可能昨天并没有登录，所以关于预测的历史记录找不到了。重新预测流程会被昨天晚会结果干扰，所以豆包就不做自评了。翻看昨天的内容，差不多3/10，还是挺准确的.

阿里通义 (2/10)

通义的输出很干脆，但是看到昨天晚会曝光的内容这里感觉有点问题，后面几条好像并没有看到啊，还好后面有来源的追溯。我们找一个充电桩的来源看一下。

点击4，就能在右边显示来源，下面还有网址。继续点击打开。

难道我看了假的315晚会？看起来这个文章也是AI生成的，夹杂着许多的广告。这个问题是AI将来会面临的最大的问题，“是否能分辨真假信息源”。别有用心的人可以通过不断在网络上发布假消息来干扰AI生成的结果。到明年315大量应用AI应该有一年时间，也许这个问题会在明年的315上曝光（我的预测）。

再回到结果上来，因为使用了完全不准确的消息源，所以这个结果也完全不能让人信服。我为苹果的用户捏一把汗。实际的命中了2和10，差不多2/10。

总结

AI模型	Deepseek	kimi	豆包	通义
1	预制菜行业：食材安全与卫生乱象	食品安全问题	预制菜 “隐秘角落”	AI技术滥用与数据安全
2	新能源汽车：电池安全与续航虚标	保健品虚假宣传	奶茶与餐饮后厨乱象	预制菜产业链隐患
3	AI与数据安全：隐私泄露与深度伪造诈骗	汽车质量问题	“高端食品” 虚假宣传	新能源汽车服务乱象
4	直播电商：虚假宣传与售后陷阱	互联网金融风险	新能源汽车与智能出行隐患	直播电商新型套路
5	医美行业：无证行医与“黑科技”陷阱	化妆品质量问题	人工智能与数据服务侵权	医疗美容灰色地带
6	金融消费：网贷隐性收费与虚拟货币骗局	快递服务乱象	网贷平台 “套路贷” 新变种	儿童用品安全升级
7	智能家居：数据泄露与产品安全隐患	教育培训陷阱	直播电商 “套路营销”	农村市场下沉漏洞
8	电动自行车：锂电池火灾隐患	智能设备安全漏洞	宠物食品 “毒粮” 事件	碳中和概念滥用
9	儿童用品：毒文具与激光玩具安全	旅游行业乱象	医美机构 “黑针会”	银发经济陷阱
10	翻新手机产业链：以次充好流入市场	宠物食品质量问题	“幽灵” 外卖作坊	互联网金融风险
预测准确率	3/10	2/10	3/10	2/10
总结	六边形王者	文科甩锅王	默默无闻干活的	幻觉大师