深化学习(RL)概念应用以及基于表格型、神经网络型、策略梯度、连续动作空间求解RL
深化学习(RL)概念应用以及基于表格型、神经网络型、策略梯度、连续动作空间求解RL目录一、概念以及应用二、基于表格型求解RL——Sarsa和learning表格型方法——Sarsa1. Sarsa 简介2. Sarsa 实战表格型方法—— Q-learning1. Q-learning简介2. Q-learning实战三、神经网络方法求解RL——DQN1. DQN简介2. DQN实践四、策略梯度方法求解RL——Policy Gradient1. Pol
原创
2020-06-26 10:56:46 ·
1731 阅读 ·
0 评论