【前言】
挺想为每一个课节的学习内容都做个介绍,但是最近太忙没时间弄,加上还是想后面深入理解透了再说。简单做个心得记录,顺便开个坑篇
【认识强化学习】
智能的核心:与环境中交互学习
像人一样的自学?
环境:已知的→规划、未知的→探索和试错‘
核心思想:
智能体agent 在环境environment 中学习,根据环境的状态 state ,执行动作action 并根据环境的反馈 reward(奖励)来指导更好的动作
强化学习和其他机器学习关系
Agent学习的两种方案
RL经典模型
Agent 与 environment进行交互的方法
快速搭建,采用百度PARL框架
求解RL方法
(后面再开篇说)
1.基于表格型方法求解
2.基于神经网络方法
3.基于策略梯度求解
4.连续动作空间上求解
基本学习框架的主要内容差不多,感受:科科老师是我的智慧女神,讲的实在太好了,浅显易懂。适合入门有个初步把握,对于后面深入学习心里有底