ChatGPT运行在OpenAI创建的语言模型架构上,称为生成预训练转换器(GPT)。根据OpenAI的说法,ChatGPT使用的特定GPT是从GPT-3.5系列中的模型微调而来的。
订阅 ChatGPT Plus,可以使用 Open AI 最先进的型号 GPT-4 访问 ChatGPT。
这种类型的生成式 AI 模型是在来自互联网的大量信息上进行训练的,包括网站、书籍、新闻文章等。使用监督学习和强化学习对语言模型进行了微调。使用来自人类反馈的强化学习(RLHF)是ChatGPT特别独特的原因。根据OpenAI的说法,通过RLHF,人类AI培训师为模型提供了对话,他们在对话中扮演了用户和AI助手这两个角色。
ChatGPT本质上是一个大模型。有大数据,大的计算力,还有一个强的计算方法。ChatGPT确实有它的优势,有它进步的点。我们要看到这一点,同时要在算法、数据、算力上怎么样能够有效结合。
chatGPT是通过最开始不断的喂数据,再通过回答各类问题后评分最后选出最合适的答案,过程有点像小学生学习过程,先读书,后写作业,指出错误后不断进步。
在海量训练参数基础上加入人工标注与强化学习。每个用户的每个问题都是对chatGPT的一次提升。
chatGPT-3.5后其自身可自我学习,自我改进。
另外,其开放的APL意味着任何人都可以通过它进行各类语言处理任务