tensorflow中的正则化函数在_Tensorflow 实现正则化(Regularization)

最新推荐文章于 2023-12-31 08:31:18 发布

weixin_39631767

最新推荐文章于 2023-12-31 08:31:18 发布

阅读量872

点赞数

文章标签： tensorflow中的正则化函数在

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39631767/article/details/111649544

版权

本文介绍了正则化在防止模型过拟合中的作用，重点讲述了Tensorflow中L2正则化的实现方式，包括使用tf.get_variable、tf.Variable、slim库以及tf.keras的两种方法，并给出了详细的操作步骤和代码示例。

摘要由CSDN通过智能技术生成

一为什么要加入正则化

首先引入一个概念：过拟合。模型对于已知数据的描述适应性过高，导致对新数据的泛化能力不佳，我们称模型对于数据过拟合（overfitting）。

怎么判断一个模型是否出现了过拟合现象呢？

最有效的方式是通过识别精度判断模型是否存在过拟合：比较模型对验证集和训练集的识别精度，如果验证集识别精度大幅低于训练集，则可以判断模型存在过拟合。

对抗过拟合有好几种方法：

增加训练数据；
减小网络模型大小
Dropout
正则化（regularization）：即限制权值 Weight-decay

本文主要针对L2正则化进行说明。

L2正则化即在损失函数C的表达式上追加L2正则化项：

上式中的C0代表原损失函数，可以替换成均方误差、交叉熵等任何一种损失函数表达式。

关于L2正则化项的几点说明：

求和∑是对网络中的所有权重进行的；
λ（lambda）为自定义参数（超参数）；
n是训练样本的数量（注意不是所有权重的数量！）；
L2正则化并没有偏置参与；

L2正则化的实现：

C对w求偏导数，可以拆分成原有C0对w求偏导，以及L2正则项对w求偏导。前者继续利用原有的反向传播计算方法，而后者可以直接计算得到：

C对于偏置b求偏导保持不变：

基于上述，就可以得到权重w和偏置b的更新方法：

最低0.47元/天解锁文章

weixin_39631767

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
tensorflow中的正则化函数在_Tensorflow 实现正则化(Regularization)

一为什么要加入正则化首先引入一个概念：过拟合。模型对于已知数据的描述适应性过高，导致对新数据的泛化能力不佳，我们称模型对于数据过拟合（overfitting）。怎么判断一个模型是否出现了过拟合现象呢？最有效的方式是通过识别精度判断模型是否存在过拟合：比较模型对验证集和训练集的识别精度，如果验证集识别精度大幅低于训练集，则可以判断模型存在过拟合。对抗过拟合有好几种方法：增加训练数据；减小网络模型大...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。