如何冲破 GPT-4 的信息茧房？

最新推荐文章于 2024-10-31 17:05:07 发布

DataFunTalk

最新推荐文章于 2024-10-31 17:05:07 发布

阅读量583

点赞数

分类专栏： 2023年DataFun线下大会文章标签：人工智能机器学习知识图谱

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/datafun_hoh/article/details/130405668

版权

2023年DataFun线下大会专栏收录该内容

6 篇文章 0 订阅

订阅专栏

由于大模型的成功经验，整个 AI 领域纷纷转向，要么是将模型架构换为 Transformer，要么是将小模型换为大模型，要么是将建模方式换为自监督、自回归范式等等。

GPT-4 推出后，各种 demo 充斥网络空间，写代码、做游戏、画图、写文案等新奇功能令人印象深刻。基于大模型的办公应用产品在近日已成为产业最热点。

然而，GPT-4 有一些非常明显的缺陷，甚至对简单的数学运算不擅长，即使是加法。如果让其展开推导过程，准确率则会大幅提升。而这两点又是与其序列生成的推理方式极其相关的。

GPT-4 采用了自回归建模方式，自回归是一种序列生成范式，从已输入的 token 序列推理下一个可能出现的 token。微软的学者通过系统的实验后指出，由于序列生成的方式使得 GPT-4 的工作记忆非常短，所以只能解决有成熟方案的问题。即便它能做复杂的微积分推理，面对简单小学数学问题的新颖变化，它也会反应不过来。通过展开解题过程提高准确率的现象，只是序列生成的自然特点。因此，GPT-4 的训练范式有天然的局限性。数学家陶哲轩也认为，GPT-4 是很好用的工具，但也仅限于工具，解决不了新的数学问题。

GPT-4 的训练数据源于互联网，但互联网的数据是否能够完整表达现实世界？我们可以把 GPT-4 生成的文案、作业、小游戏拿去交付，但可以拿它生成的建筑工程方案落地实施吗？归根结底，GPT-4 也处于一个更庞大的信息茧房里。对于现实世界的复杂性，互联网还没有足够的承载空间。

即便大模型已成为行业趋势，人工智能从业者仍然需要扎根经典技术和现实场景来构建准确、高效的人工智能应用，这是数据智能时代的基本实践之道，也是 DataFun 一直不忘的使命。

为此，DataFun 将在 DataFunCon 2023 中带来算法创新篇，包含因果推断、大模型、图机器学习、知识图谱四个主题论坛，带你一起见证人工智能实践最前沿。

欢迎大家，点击下方链接，查看更多议题详情👇

DataFunCon2023（北京站）：数据智能创新与实践大会https://www.bagevent.com/event/8416932?bag_track=csdn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。