tensorflow 实现batch normol 和l2正则化。

最大的敌人莫过于懒惰

于 2019-08-13 11:12:56 发布

阅读量390

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pengpengloveqiaoqiao/article/details/99413638

版权

L2正则化：

reg = tf.contrib.layers.apply_regularization(tf.contrib.layers.l2_regularizer(1e-4),         
                                             tf.trainable_variables())
loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)+reg

BN：

BN:

bn的layers实现函数：

步骤一：
添加tf.layers.batch_normalization(input,training=is_trainning)层，训练的时候training设置为true,测试的时候为false.添加位置：激活函数前或着后，目前两种加法没有定论谁更好。

步骤二：

训练时需要更新BN中滑动均值和滑动方差两个变量（根据各批次均值和方差计算得来）

update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
with tf.control_dependencies(update_ops):
    train_op = optimizer.minimize(loss)

步骤三：

保存BN中滑动均值和滑动方差两个变量。保存模型时默认保存的可训练变量，因此需要单独添加滑动均值和滑动方差两个变量进行保存（也可直接保存全部变量）

var_list = tf.trainable_variables()
g_list = tf.global_variables()
bn_moving_vars = [g for g in g_list if 'moving_mean' in g.name]
bn_moving_vars += [g for g in g_list if 'moving_variance' in g.name]
var_list += bn_moving_vars
saver = tf.train.Saver(var_list=var_list,max_to_keep=5)

最大的敌人莫过于懒惰

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
tensorflow 实现batch normol 和l2正则化。

L2正则化：reg = tf.contrib.layers.apply_regularization(tf.contrib.layers.l2_regularizer(1e-4), tf.trainable_variables())loss = tf.losses.sparse_so...
复制链接

扫一扫

最大的敌人莫过于懒惰 CSDN认证博客专家 CSDN认证企业博客

码龄6年

8: 原创

19万+: 周排名

158万+: 总排名

5万+: 访问

: 等级

511: 积分

12: 粉丝

27: 获赞

18: 评论

254: 收藏

私信

关注

热门文章

分类专栏

elementTree 1篇

最新评论

opencv python 三帧差法实现运动目标区域检测与完整代码
电气博格巴: 您好找到完整代码了吗
opencv python 三帧差法实现运动目标区域检测与完整代码
电气博格巴: 您好找到完整代码了吗
opencv python 三帧差法实现运动目标区域检测与完整代码
羽客S: 第23行删掉第一个—
opencv python 三帧差法实现运动目标区域检测与完整代码
m0_64348157: not enough values to unpack (expected 3, got 2）我这个出现这个问题怎么修正？百度了怎么改都改不掉
tensorflow读取pb文件推理
liyi-R: [code=python] import tensorflow.compat.v1 as tf tf.disable_v2_behavior() with tf.gfile.FastGFile(pb, 'rb') as f: graph_def = tf.GraphDef() graph_def.ParseFromString(f.read()) _ = tf.import_graph_def(graph_def,name='') with tf.Session() as sess: #print(tf.get_default_graph().get_operations()) sess.run(tf.global_variables_initializer()) input_x = sess.graph.get_tensor_by_name('input:0') out = sess.graph.get_tensor_by_name('pre:0') ret = sess.run(out,feed_dict={input_x:imgs}) # 输入是(?x224x224x3)，因此批量输入是合理的 rlt = [] for i in range(1,len(ret)//3+1): tmp_sum = ret[i*3-3]+ret[i*3-2]+ret[i*3-1] # sum the probability of >= k class rlt.append(round(tmp_sum)) # round result print(rlt) [/code] 你好，有个问题试了很多次都没有用，就是这个代码载入的pb模型这一块儿，我有两个结构一样但参数不一样的模型，但是每次调用完某一个模型之后，即使将pb输入改成另一个模型，但是输出结果还是之前的。我有尝试，发现第一个调用的模型是哪一个，之后的结果都是第一次调用的模型的结果。这可能是哪里有问题呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。