GPT开始引起人们的注意力了

GPT发展史
摘要由CSDN通过智能技术生成

GPT

相关视频:链接

OpenAI,在美国成立的人工智能研究公司,核心宗旨在于实现安全的通用人工智能(AGI)”,使其有益于人类。 OpenAI2015年由一群科技领袖,包括山姆·阿尔特曼Sam Altman)、彼得·泰尔Peter Thiel)、里德·霍夫曼Reid Hoffman)和埃隆·马斯克Elon Musk)等人创办

2019722微软投资OpenAI并与其合作;

微软-Open_ai:GPT;谷歌:BERT

bert让我们看到了希望,gpt让我们看到了未来

GPT1---微调阶段

本质上是transformer的解码器,是自回归模型-生成模型,bert是自编码模型-完形填空

GPT2---基于prompt的通用阶段--1代的基础上增加数据和模型参数量

GPT2多样性控制参数:

3个参数:温度、topp、topk

温度低:准,温度高:多样性。

Topk:卡数量

Topp:卡概率和

其他值的概率置零,永远采样不到

GPT3:让模型学习人类偏好,然后给出输出—朝通用继续迈进

gpt3消耗的资源:10000个gpu

GPT3:zero-shot、one-shot、few-shot:

zero-shot:直接问答

one-shot:举一个例子

few-shot:举若干个例子

如果输入和输出费前后分别是翻译前后,那么模型就会知道你让它做翻译任务。

Fewshot:举若干个例子,然后再问他问题

不管是多少shot,都是拼接一起,自回归

网络结构:就是transformer,主要是要有海量的数据

CODEX:个性化机器人:用leetcode训练他的写代码能力

我们变成了少儿编程师

instructGpt

chatGpt

待整理的博客

关于人工智能:ChatGPT-背后的功臣RLHF-技术详解 - 乐趣区

抱抱脸:ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文

Illustrating Reinforcement Learning from Human Feedback (RLHF)

GitHub - CarperAI/trlx: A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值