【强化学习】百度Paddle7日打卡营学习心得

【前言】

挺想为每一个课节的学习内容都做个介绍,但是最近太忙没时间弄,加上还是想后面深入理解透了再说。简单做个心得记录,顺便开个坑篇

【认识强化学习】

智能的核心:与环境中交互学习
在这里插入图片描述

像人一样的自学?

环境:已知的→规划、未知的→探索和试错‘

核心思想:

智能体agent 在环境environment 中学习,根据环境的状态 state ,执行动作action 并根据环境的反馈 reward(奖励)来指导更好的动作
在这里插入图片描述

强化学习和其他机器学习关系

在这里插入图片描述

Agent学习的两种方案

在这里插入图片描述

RL经典模型

在这里插入图片描述

Agent 与 environment进行交互的方法

快速搭建,采用百度PARL框架
在这里插入图片描述

求解RL方法

(后面再开篇说)
1.基于表格型方法求解
2.基于神经网络方法
3.基于策略梯度求解
4.连续动作空间上求解

基本学习框架的主要内容差不多,感受:科科老师是我的智慧女神,讲的实在太好了,浅显易懂。适合入门有个初步把握,对于后面深入学习心里有底

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值