chatGPT

ChatGPT基于GPT-3.5架构,通过RLHF进行微调,提供先进语言处理服务。它能自我学习改进,适用于代码生成、智能客服、机器翻译和自然语言处理。尽管数据可能滞后,但未来可能与Web联动以增强准确性。
摘要由CSDN通过智能技术生成

0549014cecb64dd7be9af6224e7e351b.jpg

ChatGPT运行在OpenAI创建的语言模型架构上,称为生成预训练转换器(GPT)。根据OpenAI的说法,ChatGPT使用的特定GPT是从GPT-3.5系列中的模型微调而来的。

订阅 ChatGPT Plus,可以使用 Open AI 最先进的型号 GPT-4 访问 ChatGPT。

这种类型的生成式 AI 模型是在来自互联网的大量信息上进行训练的,包括网站、书籍、新闻文章等。使用监督学习和强化学习对语言模型进行了微调。使用来自人类反馈的强化学习(RLHF)是ChatGPT特别独特的原因。根据OpenAI的说法,通过RLHF,人类AI培训师为模型提供了对话,他们在对话中扮演了用户和AI助手这两个角色。

 ChatGPT本质上是一个大模型。有大数据,大的计算力,还有一个强的计算方法。ChatGPT确实有它的优势,有它进步的点。我们要看到这一点,同时要在算法、数据、算力上怎么样能够有效结合。

chatGPT是通过最开始不断的喂数据,再通过回答各类问题后评分最后选出最合适的答案,过程有点像小学生学习过程,先读书,后写作业,指出错误后不断进步。

在海量训练参数基础上加入人工标注与强化学习。每个用户的每个问题都是对chatGPT的一次提升。

chatGPT-3.5后其自身可自我学习,自我改进。

另外,其开放的APL意味着任何人都可以通过它进行各类语言处理任务

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

W-HaoQqing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值