DQN是Q-Learning的升级版,通常使用深度神经网络来代替经典Q-Learning中的Q表。在经典Q-Learning中,Q表的构建和使用是算法的核心步骤,获取特定状态对应的动作价值需要查Q表,但是当环境过于复杂时,难以用Q表来进行高效的描述和查询,这便需要借助深度神经网络强大的映射能力来构造一个Q函数,这个Q函数的输入通常是某种状态,而输出是所有可能动作所对应的价值
References:
[1] 简单易懂的DQN - 知乎
DQN是Q-Learning的升级版,通常使用深度神经网络来代替经典Q-Learning中的Q表。在经典Q-Learning中,Q表的构建和使用是算法的核心步骤,获取特定状态对应的动作价值需要查Q表,但是当环境过于复杂时,难以用Q表来进行高效的描述和查询,这便需要借助深度神经网络强大的映射能力来构造一个Q函数,这个Q函数的输入通常是某种状态,而输出是所有可能动作所对应的价值
References:
[1] 简单易懂的DQN - 知乎