解码AI大模型第一节课——中山大学软件工程学院公选课

MikingG

已于 2023-09-01 11:02:11 修改

阅读量192

点赞数

分类专栏：解码AI大模型文章标签：人工智能

于 2023-08-28 23:02:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_64123373/article/details/132545822

版权

解码AI大模型专栏收录该内容

2 篇文章 0 订阅

订阅专栏

目录

决策式AI和生成式AI的区别

ChatGPT是怎么训练出来的

人1000亿神经元比1750亿参数强？

欢乐一刻

决策式AI和生成式AI的区别

决策式：这类AI系统主要是为了做出决策或分类。例如，一个邮件分类器可以决策某封邮件是垃圾邮件还是正常邮件。

生成式：这类AI系统的目标是生成新的、通常之前未见过的内容。例如，生成式对抗网络（GAN）可以生成新的图像或文本。

GPT发展史

2020：GPT-3（1750亿参数）只有文本接龙的能力，此时已经可以写小说了。

2022：InstructGPT，可以问问题了，但是现在可以输入问题了。但核心还是接龙。

ChatGPT（Generative Pre-trained Transformer）：G代表生成，P是基于互联网数据的预训练，T是一个转换器。它就是把一个语言序列，转换为了另外一堆语言序列。

ChatGPT是怎么训练出来的

细节没有披露

1.学习文字接龙。一个一个字接。

广州最高的山是哪座？白...云...山

问问题时是随机性采样（按概率来取），所以可以每次都不同。

2.人类老师引导

标出哪个答案更好

不需要穷尽问题，仅告诉喜好，根据喜好来打分（相当于定义一个Loss）

3.模仿人类老师的喜好

有了问题答案以及人类老师人工标注的偏好以后，就可以训练出一个模仿老师的模型，这里称之为Teacher Model。

4.向模拟老师学习

用增强式学习向模拟老师学习。

但第三步应该就已经训练好了？

人1000亿神经元比1750亿参数强？

医学传言：一个神经元相当于8个参数。

个人观点

马克思主义：人有从实践到认识再到实践的质的飞跃。GPT没有实践。
- 马克思主义视实践为人们在社会历史过程中的物质活动，特别是生产活动。
- 实践是认识的起点。人们在与自然和社会的物质交往中，如劳动、生产活动中，逐渐形成对外部世界的初步感性认识。然后，通过思维的加工，这些感性认识转化为理性认识。
数据输入：人的输入更多维。有多种感觉。学习资源更丰富。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。