版权声明
- 本文原创作者:谷哥的小弟
- 作者博客地址:http://blog.csdn.net/lfdfhl
在利用千帆大模型平台进行AI开发之前,有必要了解千帆大模型平台的常用概念。
数据服务相关概念
数据是模型训练的基础,在整个模型效果中起着至关重要的作用。平台提供统一的数据集管理接口,将分散的数据进行集中式纳管,节省数据集收集和管理成本。
在以上概念中,我们需要重点关注单轮对话和多轮对话。
在单轮对话中,通常只涉及一个核心问题,对话的双方只需要针对这个问题进行回答和交流,不需要对之前的回答进行进一步的追问或解释。这种对话形式通常适用于一些简单的交流场景,如咨询信息、请求服务等。
在多轮对话中,对话的双方需要在一系列问题中进行多次交流和回答,每次回答都可能引出下一个问题。这种对话形式通常适用于一些复杂的交流场景,如咨询专家意见、解决问题等。
大模型训练相关概念
大模型训练是本平台的核心功能,统一查看模型的训练状态选择更加适合的模型训练方式。
在以上概念中,我们需要重点关注奖励模型和强化学习。
奖励模型(Reward Model, RM)训练的最终目的是刻画模型的输出是否在人类看来表现不错。也就是说,奖励模型用于刻画模型输出是否符合人类评价标准。
强化学习(Reinforcement Learning, RL)又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
大模型管理相关概念
集中管理平台训练、压缩及预置的生成式大模型,支持对模型进行评估、压缩及部署。
大模型服务相关概念
发布公有云服务,将训练完成的模型部署在百度云服务器,通过云服务接口调用模型。
Prompt工程相关概念
平台支持对Prompt模板的使用和管理,并且可以对单独或批量的Prompt进行优化。