Python 人工智能每日学习 2.day 关于 ChatGPT 了解,学习b站李宏毅机器学习课程

 1.学习目的是?

了解chatGPT训练的基本原理,了解chatGPT为什么能够回答问题。

2.原理是什么?

chatGPT是基于GPT-3的对话模型,而GPT-3是由OpenAI开发的大型语言模型。其基本原理可以概括如下:

自监督学习:GPT-3使用了自监督学习的方法进行训练。在自监督学习中,模型从大量的未标记数据中学习,而无需人工标注的监督信号。在对话模型中,这意味着模型通过阅读大量的文本语料库来学习语言的结构和语义。

Transformer架构:GPT-3基于Transformer架构,它将输入序列映射到输出序列的模型。Transformer模型具有多个注意力头(attention heads),能够捕获输入序列中不同位置的相关性,从而更好地理解上下文。

大规模预训练:GPT-3是通过大规模的预训练来学习语言知识。在预训练阶段,GPT-3通过对海量文本数据进行自监督学习,从中学习到语言的模式、语义和语法等知识。

微调:在chatGPT的情况下,针对特定的对话任务,可以对GPT-3进行微调。微调是指在特定的对话数据集上,通过有监督学习的方式对模型进行额外训练,使其适应特定的对话场景和任务。

总的来说,chatGPT的训练基本原理包括自监督学习、Transformer架构和大规模预训练。这些原理的结合使得chatGPT能够在对话任务中展现出强大的语言生成和理解能力。

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

翰霖努力成为专家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值