- 博客(2)
- 收藏
- 关注
原创 纪录安装tensorflow的又一次的坑
anaconda环境的激活 服务器上激活与退出 conda activate py27# 激活 conda deactivate 本地win10系统下anaconda中激活与退出 activate py27 deactivate
2019-12-03 19:22:23 155
原创 Deep Q-learning
https://www.bilibili.com/video/av16921335?p=14 DQN 两种模型 状态和动作作输入,得到动作的Q值 状态作输入,所有动作的Q值作输出,选择Q值最大的对应的动作作为接下来要做的动作。 作业是第二种 神经网络的更新 DQN强大的根本原因 DQN有记忆库用于学习之前的经历 Q-learning是一种off-poilcy的离线学习法,可以学习当...
2019-12-03 19:05:51 256
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人