tensorlayer学习日志17_chapter7_7.2

最新推荐文章于 2021-05-08 21:47:55 发布

zouqiuyi

最新推荐文章于 2021-05-08 21:47:55 发布

阅读量1.1k

点赞数

分类专栏： tensorlayer tensorflow 文章标签： tensorflow tensorlayer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42025210/article/details/81943176

版权

在安装gym[atari]时遇到错误，提示无法make files。在Mac和Linux上安装顺利，但在Windows上通过特定命令`pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py`成功解决。运行后得知，需训练20000轮才能看到效果。

摘要由CSDN通过智能技术生成

第七章的乒乓球~~

import time
import gym
import numpy as np
import tensorflow as tf
import tensorlayer as tl
from tensorlayer.layers import *

def prepro(I):
    I = I[35:195]
    I = I[::2, ::2, 0]
    I[I == 144] = 0
    I[I == 109] = 0
    I[I != 0] = 1
    return I.astype(np.float).ravel()

image_size = 80
D = image_size * image_size
t_states = tf.placeholder(tf.float32, shape=[None, D])
network = InputLayer(t_states, name='input')
network = DenseLayer(network, n_units=200, act=tf.nn.relu, name='hidden')
network = DenseLayer(network, n_units=3, name='output')
probs = network.outputs
sampling_prob = tf.nn.softmax(probs)

batch_size = 10
learning_rate = 1e-4
gamma = 0.99
decay_rate = 0.99
render = False  
# resume = True    
model_file_name = "model_pong72"

t_actions = tf.placeholder(tf.int32, shape=[None])
t_discount_rewards = tf.placeholder(tf.float32, shape=[None])
loss = tl.rein.cross_entropy_reward_loss(probs, t_actions, t_discount_rewards)
train_op = tf.train.RMSPropOptimizer(learning_rate, decay_rate).minimize(loss)

# np.set_printoptions(threshold=np.nan)
env = gym.make("Pong-v0")

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zouqiuyi CSDN认证博客专家 CSDN认证企业博客

码龄6年

20: 原创

40万+: 周排名

145万+: 总排名

1万+: 访问

: 等级

347: 积分

9: 粉丝

2: 获赞

5: 评论

4: 收藏

私信

关注

热门文章

分类专栏

python基础 2篇
tensorflow 18篇
nlp 3篇
sk-learn
tensorlayer 18篇
opencv 2篇

最新评论

tensorlayer学习日志1_chapter2_2.4
linlinlin2_: 您好，是不是如果tf2.0以上版本， network = tl.layers.InputLayer(x, name='input')这个位置需要改变啊
tensorlayer学习日志10_chapter4_4.4
qq_43498692: 您好想问下最后打印出的卷积核为什么只有32个呢？第二层cnn不还有64个卷积核吗？
tensorlayer学习日志15_chapter5_5.4
xisi克利夫: 博主，我也遇到这个问题了，请问具体要怎么解决？
tensorlayer学习日志15_chapter5_5.4
Kanano: 能把解决方案说清楚点吗？？我也遇到了这个问题，就是params这个东西是调用save_npz产生的，而save_npz_dict没有保存params？是这个意思吗？这算是tensorlayer的bug吗
tensorlayer学习日志7_chapter3_3.5_2~9渐变求助路过的大神
测得准原理: 同样的问题，我觉得问题是没有把训练的解码器的权重注入到66页27-29行定义的解码器中，第24行拿到的权重也不知道是哪里来的。如果像你那样直接初始化肯定是得到随机的结果。我猜可能要在feed_dict中把权重注入进去。github上也没有对应的代码，只能自己再琢磨一下了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。