- 博客(1)
- 收藏
- 关注
转载 The Deep Q-Network (DQN)
作为输入,我们将通过网络传递的a作为一个状态,并为。然后,就像使用 Q-Learning 一样,我们只需要使用我们的 epsilon-greedy 策略来选择要执行的操作。
2024-07-25 11:04:16 29
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
作为输入,我们将通过网络传递的a作为一个状态,并为。然后,就像使用 Q-Learning 一样,我们只需要使用我们的 epsilon-greedy 策略来选择要执行的操作。
2024-07-25 11:04:16 29
TA创建的收藏夹 TA关注的收藏夹
TA关注的人