李宏毅LLM——ChatGPT原理剖析

李日音

已于 2024-01-16 21:55:45 修改

阅读量498

点赞数 13

文章标签： chatgpt

于 2024-01-16 20:08:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lalala12ll/article/details/135633011

版权

文章目录

Chat-GPT引言
关键技术——预训练
研究问题
玩文字冒险游戏

ChatGPT原理剖析

Chat-GPT引言

直观感受：结果有模有样、每次输出结果都不同、可以追问、幻想出的答案
误解：罐头回答、答案是网络搜索的结果
真正做的事：文字接龙，function，几率分布 -> 采样

不仅包含现在的输入还有过去的输入，大语言模型 = 文字接龙

训练：寻找函数的过程，使用了网络资料
测试：没有联网

关键技术——预训练

在这里插入图片描述
一般的机器学习：
督导式学习

人类提供资料有限，GPT就无法回答
在这里插入图片描述
使用网络上的文字来教GPT学习

GPT：2018年 117M模型，1G数据。单纯用网络资料学习
GPT-2：2019年，1542M模型，40G数据。开始像模像样地瞎掰，可以回答问题
GPT-3：2020年，175B模型，45T资料筛选出的570G数据（哈利波特全集的30w倍）。可以写程序了。
参数量越大，正确率越高，但似乎接近极限了

网络资料的缺陷：不受控

解决：督导式学习，微调

预训练的帮助：也许人类不需要教会GPT所有语言。只教会GPT某一个语言的某种任务，自动学会其他语言的相同任务

多种语言预训练，只在某种语言上微调

增强式学习只需要人判断答案好不好就行

研究问题

对NLP领域影响很大，也带来了新的研究方向。

如何精准提升需求？催眠（Prompting）。有没有更好的方式找到prompting
如何更正错误？把某一个答案弄对，弄错了更多答案

在这里插入图片描述

侦测AI生成的物件
不小心泄露人类秘密
machine unlearning

在这里插入图片描述

玩文字冒险游戏

提供足够的prompting，midjourney生成图片

在这里插入图片描述

关注

13
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
李宏毅LLM——ChatGPT原理剖析

ChatGPT原理剖析。- 直观感受：结果有模有样、每次输出结果都不同、可以追问、幻想出的答案- 误解：罐头回答、答案是网络搜索的结果- 真正做的事：文字接龙，function，几率分布 -> 采样
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。