正则化面经题目

最新推荐文章于 2021-05-26 16:21:52 发布

Better-1

最新推荐文章于 2021-05-26 16:21:52 发布

阅读量197

点赞数

分类专栏：模式识别与机器学习

原文链接：https://www.jianshu.com/p/7d5997878520

版权

模式识别与机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

正则化稀疏解决方案中，确保向量党的每个分量都非常有效，每个组件都必须捕获一些有用的功能或数据模式。(只要精英，其余的die)像dropout，去除一些权重可以使得剩下的权重学习到更多的只是。

L1和L2是正则化项，又叫做罚项，是为了限制模型的参数，防止模型过拟合而加在损失函数后面的一项。

L1和L2正则化的作用
L1正则化可以产生稀疏权值矩阵，即产生一个稀疏模型，可以用于特征选择。
L2正则化可以防止模型过拟合。（一定程度上，L1也可以防止过拟合）。

L1: 在这里插入图片描述
两个向量或矩阵的 L1-norm
leisi

L2
在这里插入图片描述
leisi

L1正则&L2正则的区别是什么？

L1正则化是指在损失函数中加入权值向量w的一范数，即各个元素的绝对值之和；L2正则化指在损失函数中加入权值向量w的平方和。

L1的功能是使权重稀疏，而L2的功能是使权重平滑。

稀疏解释：
https://blog.csdn.net/fantacy10000/article/details/90647686

L1正则为什么可以得到稀疏解？

以下图看的直径，x/y坐标分别是参数w1/w2。(L1在高维空间中诗歌八面体0)
下图所示为二维平面，只有w1和w2两个权重，右上角是经验损失的等值线。第一个交点就是最优解。
L2正则化相当于为参数定义了一个圆形的解空间(w1²+w2²)，而L1正则化相当于为参数定义了一个菱形的解空间。L1“棱角分明”的解空间显然更容易与目标函数等高线在脚点碰撞。从而产生稀疏解。

在这里插入图片描述

2.函数叠加的角度
考虑一维的情况，横轴是参数的值，纵轴是损失函数，加入正则项之后，损失函数曲线图变化如下：

以下通过函数

在这里插入图片描述

3.贝叶斯先验
高斯分布在这里插入图片描述
拉普拉斯分布

当均值为0时，高斯分布在极值点处是平滑的，也就是高斯先验分布认为w在极值点附近取不同值的可能性是接近的。但对拉普拉斯分布来说，其极值点处是一个尖峰，所以拉普拉斯先验分布中参数w取值为0的可能性要更高。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则化面经题目

正则化稀疏解决方案中，确保向量党的每个分量都非常有效，每个组件都必须捕获一些有用的功能或数据模式。(只要精英，其余的die)像dropout，去除一些权重可以使得剩下的权重学习到更多的只是。L1正则&L2正则的区别是什么？L1正则化是指在损失函数中加入权值向量w的一范数，即各个元素的绝对值之和；L2正则化指在损失函数中加入权值向量w的平方和。L1的功能是使权重稀疏，而L2的功能是使权重平滑。L1正则为什么可以得到稀疏解？以下图看的直径，x/y坐标分别是参数w1/w2。(L1在高维空间中诗
复制链接

扫一扫

专栏目录

博客等级

码龄5年

318
原创

189
点赞

784
收藏

4774
粉丝

关注

私信

热门文章

分类专栏

最新评论

快速排序详解
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
csv.reader和next()
Battery125: next(csv)返回的数据类型是列表吗？
两个模型或者特征的融合-concatenate笔记
长腿老头o3o: 融合2个model有什么作用呀
问题笔记：keras定义相同的loss和metric，两者输出不同的原因
hxisj: 你弄明白了吗？我的是训练集上是满足相同，但是测试集上有小差别
两个模型或者特征的融合-concatenate笔记
qq_54176463: model1和model2是tensor怎么用.output呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。