【NLP学习-1】正则化

最新推荐文章于 2024-03-31 09:38:40 发布

rrrimp

最新推荐文章于 2024-03-31 09:38:40 发布

阅读量221

点赞数

分类专栏： NLP 文章标签：机器学习正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rrrimp/article/details/114554184

版权

NLP 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

【NLP学习】正则化

1 正则化
2 L2正则项(岭回归)
- 什么情况下用L2正则项
- 什么情况下不用L2正则项
3 L1正则项
4 ElasticNet回归：（L1、L2正则项）
- 什么情况下用ElasticNet回归

学习笔记：来自https://github.com/NLP-LOVE/ML-NLP/blob/master/Machine%20Learning/Liner%20Regression/1.Liner%20Regression.md

1 正则化

欠拟合、过拟合怎么解决？
解决方式：正则化

2 L2正则项(岭回归)

以线性回归来说，Loss function 如下：
在这里插入图片描述
L2正则化相当于：

J0表示上面的loss function,正则项可以表示成

可以理解成此时我们的任务变成在L约束下求出J取最小值的解。求解J0的过程可以画出等值线。同时L2正则化的函数L也可以在w1w2的二维平面上画出来。
在这里插入图片描述
L表示为图中的黑色圆形，随着梯度下降法的不断逼近，与圆第一次产生交点，而这个交点很难出现在坐标轴上。这就说明了L2正则化不容易得到稀疏矩阵，同时为了求出损失函数的最小值，使得w1和w2无限接近于0，达到防止过拟合的问题。

什么情况下用L2正则项

只要数据线性相关，用LinearRegression拟合的不是很好，需要正则化，可以考虑使用岭回归(L2),

什么情况下不用L2正则项

输入特征的维度很高,而且是稀疏线性关系的话，岭回归就不太合适,考虑使用Lasso回归。

3 L1正则项

L1正则化(Lasso回归)可以使得一些特征的系数变小,甚至还使一些绝对值较小的系数直接变为0，从而增强模型的泛化能力。

对于高的特征数据,尤其是线性关系是稀疏的，就采用L1正则化(Lasso回归),或者是要在一堆特征里面找出主要的特征，那么L1正则化(Lasso回归)更是首选了。

4 ElasticNet回归：（L1、L2正则项）

在这里插入图片描述

什么情况下用ElasticNet回归

ElasticNet在我们发现用Lasso回归太过(太多特征被稀疏为0),而岭回归也正则化的不够(回归系数衰减太慢)的时候，可以考虑使用ElasticNet回归来综合，得到比较好的结果

最后，需要注意的是：
当噪声符合正态分布时，其因变量必然也符合正态分布。

在用线性回归模型拟合数据之前，首先要求数据应符合或近似符合正态分布，否则得到的拟合函数不正确。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

目录

分类专栏

JAVA 2篇
bug
杂 1篇
知识图谱 3篇
DL 1篇
NLP 2篇

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。