强化学习:Q-learning与DQN(Deep Q Network)
文章目录Q-learningDQNexperience replayfix Q type Q-learning是一种很常用的强化学习方法,DQN则是Q-learning和神经网络的结合。Q-learning 首先要设计状态空间s,动作空间a,以及reward。一次transition就是(s,a,w,s_)一次episode就是DQNQ-learning如果状态很多,动作很多时,需要建立的q表也会十分的庞大,因此神经网络就是用来算动作的q-value的为了帮助收敛experience
原创
2020-06-05 11:26:23 ·
8772 阅读 ·
1 评论