- 博客(1)
- 收藏
- 关注
原创 tensorpack之predict解析
在ga3c中,每个agent在获得当前的state(例如游戏图像)后需要向master请求下一步的动作/V值。一个naive的master实现可以这样(简单起见不考虑epsode_finish): while True: identity, image = input_queue.recv() //agent的标识,和相应帧 action = sess.run(action,
2017-04-25 17:01:58 3673
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人