这是我的第一篇CSDN博客:)
最近在写DDPG的时候发现action网络输出有问题,action网络输出层建立如下:
self.a_net = tf.layers.dense(self.net, self.a_dim,
activation=tf.nn.sigmoid,
name='a',
kernel_initializer=tf.truncated_normal_initializer(0,0.1),
bias_initializer=tf.constant_initializer(0.1),
trainable=trainable)
师兄建议把网络权重调出来看一下变化趋势,而我的action网络是用tf.layers.dense()构建的,所以查了一下如何保存tf.layers.dense()的网络的权重。
有如下两种方式: