文章目录 QLearning用tensorflow搭建神经网络1 图解 Loss2 DQN算法思路讲解 QLearning Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)] 用tensorflow搭建神经网络 tensorflow基础教程参考网址网址 搭建网络参考网址 1 图解 Loss 参考文献 2 DQN算法思路讲解 参考文献 self.state_list = np.identity(self.state_num)