机器学习基础篇-正则化

最新推荐文章于 2024-03-12 19:56:37 发布

Mr.Wiggles

最新推荐文章于 2024-03-12 19:56:37 发布

阅读量253

点赞数

分类专栏：机器学习基础文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Vihagle/article/details/118385364

版权

机器学习基础专栏收录该内容

31 篇文章 4 订阅

订阅专栏

正则化项

正则化是一种防止模型过拟合的方法，它常被添加在损失函数中。

L2正则化项
$minJ(W,b)=\frac{1}{m}\sum^m_{i=1}L(\widehat{y}^i,{y}^i)+\frac{\lambda}{2m}||W||^2_2$

在上式公式中, $\frac{\lambda}{2m}||W||^2_2$ 就是正则化项， $\lambda$ 表示正则化项的超参数，也可以间接理解为学习率。
L2正则化也可以理解为一种权重衰减的方法。

对于逻辑回归模型，W作为一种参数（W的维度取决于特征的维度），那么L2正则化项可以表示为：
$||W||_2^2=\sum^{dimension}_{j=1}W^2_j$

对于具有多层的神经网络模型，层与层之间存在多个参数矩阵。每层W的矩阵可以表达为 $n^{[l]},n^{[l-1]}）$ ，在等式中， $l$ 表示第 $l$ 层隐层， $n^{[l]}$ 表示第 $l$ 层隐层的神经元个数，所以，L2正则化项可以表示为：
$\frac{\lambda}{2m}\sum^L_{l=1}||W^l||^2_2 \\ ||W^l||^2_2=\sum^{n^{|l-1|}}_{i=1} \sum^{n^{|l|}}_{j=1}(W_{ij}^l)^2$

L1正则化项
$minJ(W,b)=\frac{1}{m}\sum^m_{i=1}L(\widehat{y}^i,{y}^i)+\frac{\lambda}{2m}||W^l||\\ ||W^l||=\sum^{n^{|l-1|}}_{i=1}\sum^{n^{|l|}}_{j=1}W^l_{ij}$

如果我们采用L1正则化，那么参数W会变得很稀疏。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Mr.Wiggles CSDN认证博客专家 CSDN认证企业博客

码龄4年

87: 原创

3万+: 周排名

4万+: 总排名

7万+: 访问

: 等级

1008: 积分

3974: 粉丝

101: 获赞

40: 评论

335: 收藏

私信

关注

热门文章

分类专栏

最新评论

RS推荐系统-LSH最近邻查找+MiniHash
Q794469: 大佬牛批！通俗易懂！
工作繁忙 + 想法枯竭 = 许久未更
Mr.Wiggles: 如果样本不平衡，可以通过降/升采样的方法去缓解样本分布，但是得注意的是，一味的采样使得平衡并不是最终解决方法，采样后的分布还得参照自然分布。比如正样本只占到TTL的0.01%，我们通过采样使其占比变成3%即可，而不是强行变成正负样本五五开，因为采样后样本的分布不能脱离自然分布（比如买彩票的概率本身就极低）
训练集（离线）与测试集（上线）效果差距很大怎么办？
Mr.Wiggles: 我觉得分两点来看： 1.你可以对比做/不做smote，对比两个测试集的recall有没有uplift，如果有说明smote对模型的是有提升的 2.其次，smote影响recall可能只是个充分非必要条件，还得看你的数据质量高低，特征维度是否全面。这些也会影响模型的精度上限
训练集（离线）与测试集（上线）效果差距很大怎么办？
不暴饮暴食好难啊: 楼主，目前我也在做离职预测，用smote方法来平衡样本，在训练集和验证集表现挺好的，但是在测试集上的recal效果不好，这种情况怎么处理提高我的recall呢
工作繁忙 + 想法枯竭 = 许久未更
不暴饮暴食好难啊: 亲，想了解对于不平衡的数据集进行预测的问题，样本分类极度不均，可能一万个样本里只有几十个正样本

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.Wiggles 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。