ChatGPT的来源-InstructGPT论文简要介绍

阿达斯加

已于 2023-02-14 16:44:37 修改

阅读量6.8k

点赞数 4

分类专栏：学习笔记文章标签：人工智能深度学习

于 2023-02-14 09:29:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27565603/article/details/129020677

版权

文章目录

前言
一、ChatGPT是什么？
二、ChatGPT的前身InstructGPT论文解读
总结

前言

现在大火的ChatGPT功能十分强大，不仅可以回答用户问题，编写故事，甚至还可以写代码。ChatGPT跟OpenAI之前发表的InstructGPT使用的模型方法比较类似，只是训练的数据不同，为了探索ChatGPT的原理，笔者找来2022年3月发表的InstructGPT的论文，做了简要的介绍。

一、ChatGPT是什么？

ChatGPT，美国OpenAI 研发的聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

二、ChatGPT的前身InstructGPT论文解读

论文下载地址：

https://arxiv.org/abs/2203.02155

主要内容：

这篇文章的主要内容是大型语言模型并不能很好的遵循用户的意图，这些模型生成的内容可能对用户毫无帮助，与用户的期待并不一致。为了解决这个问题，InstructGPT使用引入了人类反馈来训练模型，虽然模型仍然有一些小的错误，但是这种方法给大型语言模型输出结果与人类期望一致提供了未来的研究方向。ChatGPT也是在InstructGPT模型的基础上开发出来的。

模型训练

训练模型主要有三个步骤，

最低0.47元/天解锁文章

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
7
评论
ChatGPT的来源-InstructGPT论文简要介绍

现在大火的ChatGPT功能十分强大，不仅可以回答用户问题，编写故事，甚至还可以写代码。ChatGPT跟OpenAI之前发表的InstructGPT使用的模型方法比较类似，只是训练的数据不同，为了探索ChatGPT的原理，笔者找来2022年3月发表的InstructGPT的论文，做了简要的介绍。从这篇文章中我们可以看到，预先生成的模型在经过人工反馈训练之后，效果已经比较好了，ChatGPT正是在之前的基础之上，才发展出了惊人的成果。
复制链接

扫一扫

专栏目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

阿达斯加 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。