接下来我们深入dopamine内部,看看究竟是个什么玩意儿
1.创建一个Runner对象
1.1在对象的初始化函数中执行create_environment_fn
放在self._environment中
就是这个游戏
1.2在create_agent_fn创建一个MyRandomDQNAgent对象
sess | 计算图,记录操作 |
num_action | 9 agent的行为数量 |
gamma | 0.99 |
update_horizon | 1,多久执行一次参数更新 |
min_replay_history | 20000,训练Q函数之前的次数 |
updata_period | 4,DQN更新的周期 |