什么是强化学习?

强化学习来自机器学习的一种术语。

机器学习有以下几种:

  • 监督学习

  • 无监督学习

  • 强化学习

强化学习是一种机器学习,其中代理人通过对这些动作的结果执行某些动作和学习来学习如何在环境中行为。

代理人采取行动时,根据结果得到报酬。这样,学习过程继续取决于积极和消极的回报。

学习是以与环境的互动为基础的。代理人发现哪个动作将给出最大回报。根据这一点,代理人采取行动。

以下开价盘适用于强化学习:

当我们无法确定什么是真的时,我们应该根据最可能的事情采取行动。笛卡尔
以下是强化学习的重要组成部分:

  1. 代理人采取行动的人。

  2. 环境代理人采取行动的地方

  3. 状态代理人的情况。

  4. 动作代理人所做的事。

  5. 奖励-测量代理人所采取的行动的成功或失败。

  6. 强化学习围绕着国家、行动和回报。

  7. 代理人根据国家采取行动,并在此基础上获得奖励。

强化学习有不同的途径:

  • 基于价值的

  • 基于策略的

  • 基于模型的

强化学习有两个权衡:

  • 勘探-找到有关环境的更多信息。

  • 开发-最大限度地利用奖励。

这是强化学习.这是所有的。

定义强化学习 天才写手
转载自:https://uhomework.com/a/rengongzhinenjiaocheng/20180806/16495.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值