文心一言开发指南04——千帆大模型平台常用概念


版权声明

  • 本文原创作者:谷哥的小弟
  • 作者博客地址:http://blog.csdn.net/lfdfhl

在这里插入图片描述
在利用千帆大模型平台进行AI开发之前,有必要了解千帆大模型平台的常用概念。

数据服务相关概念

数据是模型训练的基础,在整个模型效果中起着至关重要的作用。平台提供统一的数据集管理接口,将分散的数据进行集中式纳管,节省数据集收集和管理成本。

在这里插入图片描述

在以上概念中,我们需要重点关注单轮对话和多轮对话。

在单轮对话中,通常只涉及一个核心问题,对话的双方只需要针对这个问题进行回答和交流,不需要对之前的回答进行进一步的追问或解释。这种对话形式通常适用于一些简单的交流场景,如咨询信息、请求服务等。

在多轮对话中,对话的双方需要在一系列问题中进行多次交流和回答,每次回答都可能引出下一个问题。这种对话形式通常适用于一些复杂的交流场景,如咨询专家意见、解决问题等。

大模型训练相关概念

大模型训练是本平台的核心功能,统一查看模型的训练状态选择更加适合的模型训练方式。

在这里插入图片描述
在以上概念中,我们需要重点关注奖励模型和强化学习。

奖励模型(Reward Model, RM)训练的最终目的是刻画模型的输出是否在人类看来表现不错。也就是说,奖励模型用于刻画模型输出是否符合人类评价标准。

强化学习(Reinforcement Learning, RL)又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

大模型管理相关概念

集中管理平台训练、压缩及预置的生成式大模型,支持对模型进行评估、压缩及部署。

在这里插入图片描述

大模型服务相关概念

发布公有云服务,将训练完成的模型部署在百度云服务器,通过云服务接口调用模型。

在这里插入图片描述

Prompt工程相关概念

平台支持对Prompt模板的使用和管理,并且可以对单独或批量的Prompt进行优化。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

谷哥的小弟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值