2020-2-14 深度学习笔记7 - 深度学习中的正则化4（稀疏表示-稀疏化激活单元(元素稀疏)，Bagging和其他集成方法，Dropout-廉价Bagging近似）

最新推荐文章于 2024-01-08 01:24:24 发布

没人不认识我

最新推荐文章于 2024-01-08 01:24:24 发布

阅读量1.1k

点赞数

分类专栏：深度学习 python IT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42555985/article/details/104306588

版权

第七章深度学习中的正则化

官网链接
 2020-2-9 深度学习笔记7 - 深度学习中的正则化1（参数范数惩罚和范数惩罚约束）
2020-2-12 深度学习笔记7 - 深度学习中的正则化2（欠约束，数据集增强，噪声鲁棒性，输出目标注入噪声）
2020-2-13 深度学习笔记7 - 深度学习中的正则化3（半监督,多任务,提前终止-解决过拟合,参数绑定与参数共享）

稀疏表示

前文所述的权重衰减直接惩罚模型参数。另一种策略是惩罚神经网络中的激活单元，稀疏化激活单元。这种策略间接地对模型参数施加了复杂惩罚。

我们已经讨论过 $L^1$ 惩罚如何诱导稀疏的参数，即许多参数为零（或接近于零）。另一方面，表示的稀疏描述了许多元素是零（或接近零）的表示。

表示的范数惩罚正则化是通过向损失函数 $J$ 添加对表示的范数惩罚来实现的。我们将这个惩罚记作 $\Omega(h)$ 。和以前一样，我们将正则化后的损失函数记作 $\tilde J$ ：
$J (θ; X, y) = J (θ; X, y) + α Ω (h)$
其中 $\alpha \in [0, \infty]$ 权衡范数惩罚项的相对贡献，越大的 $\alpha$ 对应越多的正则化。

正如对参数的 $L^1$ 惩罚诱导参数稀疏性，对表示元素的 $L^1$ 惩罚诱导稀疏的表示： $\Omega(h) = ||h||_1 = \sum_i |h_i|$ 。除了 $L^1$ 惩罚诱导稀疏，其他方法还包括从表示上的Student- $t$ 先验导出的惩罚和KL散度惩罚。

含有隐藏单元的模型在本质上都能变得稀疏。

稀疏表示也是卷积神经网络经常用到的正则化方法。L¹正则化会诱导稀疏的参数，使得许多参数为0；而稀疏表示是惩罚神经网络的激活单元，稀疏化激活单元。换言之，稀疏表示是使得每个神经元的输入单元变得稀疏，很多输入是0。

例如下图，只依赖于上一层的3个神经元输入 $x_1$

最低0.47元/天解锁文章

没人不认识我

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。