Tensorflow中ExponentialMovingAverage的原理及用法

最新推荐文章于 2023-06-30 19:34:13 发布

kuweicai

最新推荐文章于 2023-06-30 19:34:13 发布

阅读量9.3k

点赞数 8

分类专栏：深度学习文章标签：深度学习 tensorflow ExponentialMovingAverage 滑动平均原理 tf.control_dependencies()

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kuweicai/article/details/80517284

版权

本文介绍了Tensorflow中ExponentialMovingAverage的原理及其在深度学习中的应用，阐述了滑动平均如何提高模型在测试时的健壮性，并通过实际例子展示了如何在训练过程中使用和恢复模型的滑动平均参数。

摘要由CSDN通过智能技术生成

整理自以下两篇博客：

1）. tensorflow ExponentialMovingAverage

2）. Tensorflow深度学习之九：滑动平均模型

一. 滑动平均的作用ExponentialMovingAverage（）

滑动平均模型的作用是提高测试值上的健壮性。那它是如何实现这个功能的呢？其实滑动平均模型的原理就是一阶滞后滤波法，其表达式如下：

new_value=(1−a)×value+a×old_valuenew_value=(1−a)×value+a×old_value

其中a的取值范围[0,1]，具体就是：本次滤波结果=(1-a)本次采样值+a上次滤波结果，采用此算法的目的是：
1、降低周期性的干扰；

2、在波动频率较高的场合有很好的效果。

二. Tensorflow中的ExponentialMovingAverage()

假如我们训练模型迭代了100K，每2K步保存一个snapshot。在evaluation时，我们可以只使用最后得到的model-100K，也可以通过cross validation选出一最佳的model，如model-98K。但Googlers发现(https://www.tensorflow.org/versions/r1.0/api_docs/python/tf/train/ExponentialMovingAverage)：

When training a model, it is often beneficial<

最低0.47元/天解锁文章

关注

8
点赞
踩
25

收藏

觉得还不错? 一键收藏
2
评论
Tensorflow中ExponentialMovingAverage的原理及用法

整理自以下两篇博客：1）.tensorflow ExponentialMovingAverage2）.Tensorflow深度学习之九：滑动平均模型一. 滑动平均的作用ExponentialMovingAverage（）滑动平均模型的作用是提高测试值上的健壮性。那它是如何实现这个功能的呢？其实滑动平均模型的原理就是一阶滞后滤波法，其表达式如下：new_value=(...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。