GPT开始引起人们的注意力了

涛涛北京

已于 2023-02-21 10:51:18 修改

阅读量512

点赞数

分类专栏： NLP 文章标签：自然语言处理

于 2023-02-20 11:02:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43522964/article/details/129120348

版权

NLP 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

GPT发展史

摘要由CSDN通过智能技术生成

GPT

相关视频：链接

OpenAI，在美国成立的人工智能研究公司，核心宗旨在于“实现安全的通用人工智能(AGI)”，使其有益于人类。 OpenAI于2015年由一群科技领袖，包括山姆·阿尔特曼（Sam Altman）、彼得·泰尔（Peter Thiel）、里德·霍夫曼（Reid Hoffman）和埃隆·马斯克（Elon Musk）等人创办

2019年7月22日微软投资OpenAI并与其合作；

微软-Open_ai:GPT；谷歌：BERT

bert让我们看到了希望，gpt让我们看到了未来

GPT1---微调阶段

本质上是transformer的解码器，是自回归模型-生成模型，bert是自编码模型-完形填空

GPT2---基于prompt的通用阶段--1代的基础上增加数据和模型参数量

GPT2多样性控制参数:

3个参数：温度、topp、topk

温度低：准，温度高：多样性。

Topk：卡数量

Topp：卡概率和

其他值的概率置零，永远采样不到

GPT3:让模型学习人类偏好，然后给出输出—朝通用继续迈进

gpt3消耗的资源：10000个gpu

GPT3：zero-shot、one-shot、few-shot:

zero-shot：直接问答

one-shot：举一个例子

few-shot：举若干个例子

如果输入和输出费前后分别是翻译前后，那么模型就会知道你让它做翻译任务。

Fewshot：举若干个例子，然后再问他问题

不管是多少shot，都是拼接一起，自回归

网络结构：就是transformer，主要是要有海量的数据

CODEX：个性化机器人：用leetcode训练他的写代码能力

我们变成了少儿编程师

instructGpt

chatGpt

待整理的博客

关于人工智能:ChatGPT-背后的功臣RLHF-技术详解 - 乐趣区

抱抱脸：ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文

Illustrating Reinforcement Learning from Human Feedback (RLHF)

GitHub - CarperAI/trlx: A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
GPT开始引起人们的注意力了

GPT发展史
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。