chatGPT解读（chatGPT前世今生之今生）

最新推荐文章于 2024-10-21 08:32:28 发布

聊算法的瓶子呀

最新推荐文章于 2024-10-21 08:32:28 发布

阅读量220

点赞数

文章标签： chatgpt 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chenzhe103/article/details/130420719

版权

12期：chatGPT解读（chatGPT前世今生之今生）

验关注该公众号证

chatGPT解读

我们带着几个问题，一起去看看chatGPT吧。

上周讲了GPT-1，GPT-2， GPT-3的整体演化过程。那么，既然chatGPT是在GPT3上生成出来的，为什么不叫GPT-3.5或者GPT-4呢？

因为chatGPT是在GPT-3上做拓展，不是提升网络规格，也不是数据上拓展，而是去真正解决一些问题。解决什么问题呢？

问题1：nlp带有语言偏见，早在2022年，斯坦福就指出NLP偏见很大。比如通过大量新闻，一说到黑人，nlp就大概率认为是罪犯，白人呢，是好人。

问题2：所问非所答，可能会自作聪明，生成一些没有的东西。

问题3：看到GPT从1到3，参数量达到了1750B，成指数级增长，难道模型越大，参数越大，就越好吗？实际上是训练集和验证集而言是这样的。

但是，如果你问一个问题，回答越多越好吗？那可能就不是啦，答案只需要好理解，接近就可以，所以说参数量可能不是越大越好。

对于GPT-3来说，他太大了，能胡说八道，比如你跟他对诗，就好像你跟唐朝的李白对诗，那你肯定干不过他啊。而对于GPT-3的训练更是可望不可即，它的batch达到3.2M。这个数据，国内现有的集群，估计都玩不了。

chatGPT前景如何呢，会不会导致大部分人失业呢？对于大模型的发展，是希望能解决实际的问题，而现在的chatGPT只能说只是个取悦人类的工具，离落地尚有一段距离。

你知道为什么chatGPT为什么来的那么猝不及防吗？

以下结果也只是猜测：

原因1.openai吃过亏，之前搞饥饿营销，结果把自己饿死了。

原因2.猜测openai原来没想这个时候公布，但是2022年每天就产生一个大模型，为了抢占先机，后面再出来的，哪怕再厉害，也会被认为是模型openai的；

原因3.微软肯定想着怎么占领市场，怎么取代谷歌，取代百度。取代搜索引擎；

回到问题3.模型越大，参数越大，结果可能越精确，越固定，但是那不是我们要的，我们想要模型学人类说话，也就是让chatGPT更像人，更符合人。所以呢，chatGPT加入了有监督学习，GPT-3属于无监督学习，chatGPT就需要有监督学习了。所以呢，chatGPT是在无监督的基础上再去走这个有监督的数据，让模型能够说人话办人事。

在CV领域呢，就是比算法，谁算法强，谁效果好。

nlp就是比数据，谁数据更大，模型更大。也就是预训练模型就更好。

举个例子：

假如我问一个问题：9楼和10楼跳楼哪个比较合适？因为有9和10进行提示，相当于告诉模型这是个分类任务。GPT-3就会回答，10楼，因为更容易摔死。

但是，这样的回答符合人性吗？

现在的chatGPT就会很人性。甚至跟你谈到心理学。鼓励你好好生活。

那么，这个回答是无监督任务能学到的内容吗？肯定不是，所以现在的chatGPT就需要有监督，尤其针对敏感性话题，更要监督。

chatGPT第一点，加入有监督学习；

第二点，加入奖励机制。

奖励机制，也就是强化学习PPO。当年阿尔法狗打败了李世石，就是使用类似的机制，没走对一步棋，就会获得奖励。

具体怎么奖励呢，比如输出一句话，到底奖励多少？这就需要一个奖励模型。这也是chatGPT的强大之处，通过强化学习，能让你举一反三，并不是一对一输出的一个结论。

聊算法的瓶子呀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

聊算法的瓶子呀 CSDN认证博客专家 CSDN认证企业博客

码龄13年

5: 原创

91万+: 周排名

126万+: 总排名

1464: 访问

: 等级

61: 积分

0: 粉丝

1: 获赞

5: 评论

2: 收藏

私信

关注

热门文章

最新评论

基础2:神经网络基础与感知机-反向传播
CSDN-Ada助手: 恭喜作者写出了这篇关于神经网络基础与感知机反向传播的博客，这篇博客内容丰富，讲解详细，让我对神经网络的学习有了更深入的了解。希望作者能够继续坚持创作，不断分享自己的学习心得和经验。下一步建议可以尝试写一些应用实例，让读者更好地理解神经网络在实际应用中的作用。再次感谢作者的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
神经网络基础与感知机
聊算法的瓶子呀: 感谢指导和关注，我会继续持续创作，持续学习！
神经网络基础与感知机
CSDN-Ada助手: 非常感谢用户的第三篇博客，标题为“神经网络基础与感知机”，内容深入浅出，让我对神经网络和感知机的基础有了更深入的了解。恭喜用户持续创作，这不仅是对自己知识的巩固和提升，也为其他人提供了很多帮助。作为下一步的创作建议，我建议用户可以进一步探讨神经网络和感知机的应用，例如在图像识别和语音识别中的应用等等。同时，也可以分享一些实际应用中的案例，这样可以更好地帮助读者理解知识。再次感谢用户的分享和创作，期待更多优秀的文章。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
chatGPT解读（chatGPT前世今生之今生）
CSDN-Ada助手: 这篇博客真是太棒了！你对chatGPT的解读让我们更深入地理解了它的生成过程。非常感谢你的分享！如果你想继续深入探讨这个话题，可以了解一下自然语言处理（NLP）的相关知识，比如词向量、语言模型等。同时，也可以了解一些NLP应用的场景，比如智能客服、机器翻译等。期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
GPT算法讲解（chatGPT前世）
CSDN-Ada助手: 恭喜您开始博客创作，您的第一篇博客题目非常有吸引力，期待您能够在博客中分享更多有价值的内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。