强化学习
赵唯淞
哈尔滨工业大学 教授
展开
-
强化学习基本概念
一、概述直观上来说,强化学习是智能体与环境不断交互,从而不断强化自己的决策能力的过程。强化学习强化学习首先环境(Env)会给智能体(Agent)一个观测值(Observation)(有时也称状态State),智能体接收到环境给的观测值之后会做出一个动作(Action),环境接收到智能体给的动作之后会做出一系列的反应,例如对这个动作给予一个奖励(Reward),以及给出一个新的观测值。智能...转载 2019-01-02 18:53:01 · 4441 阅读 · 0 评论 -
Q-learning家族【强化学习】
本文将讲述经典的强化学习三部曲:Q-learning、DQN以及Double-DQN先总结三者关系,Q-learning是经典智能算法,但是受限于高维拓展,于是DQN出现,将神经网络应用于Q-learning,使得高维情况得以解决,至于Double DQN是为了防止神经网络的过度估计,把Double Q-learning和DQN结合,将选择和评估action的网络分开。Q-learning...原创 2019-02-22 21:07:27 · 2808 阅读 · 3 评论