一、chatGPT基本原理和工作流程
GPT:生成式预训练Transformer模型,是一种自然语言NLP模型,包含多个编码器和解码器对输入文本进行编码和生成。
ChatGPT使用Transformer结构,在OPENAI的GPT3.5大模型基础上使用监督和强化学习进行微调。
ChatGPT工作流程:
1.有监督调优,ChatGPT在预训练语言模型使用少量已标注的数据进行调优(给定提示下响应)
2.模拟人类偏好,标注者对大量SFT模型输入投票,创建一个比较数据组成新数据集。在这个数据集上训练新模型即训练回报模型。
3.chatGPT使用PPO近端划策略强化学习算法在训练回报模型上训练进一步调优SFT(有监督调优)
二、ChatGPT使用场景
1.百科问答,直接提问整理回答相关知识
2.根据要求编写代码
3.生成文本内容创作,文本摘要文本翻译,PPT撰写等
4.文生图
三、ChatGPT发展趋势
1.私有化部署企业应用,保护隐私数据安全
2.各种类型ai智能终端工具,如ai企业办公工具,ai助手等
3.生成内容可控合规审查检测
4.AI辅助决策,根据专业知识数据决策辅助
ChatGPT基本原理及应用场景
于 2023-12-09 18:33:14 首次发布