特征缩减技术(shrinkage): lasso和岭回归

最新推荐文章于 2023-11-13 21:12:08 发布

开开_王子

最新推荐文章于 2023-11-13 21:12:08 发布

阅读量1w

点赞数 2

分类专栏：数据挖掘与机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/kan2281123066/article/details/78753698

版权

本文介绍了特征缩减技术中的lasso和岭回归，包括它们的目的和区别。L1正则化（lasso）通过引入惩罚项，使得部分特征系数归零，适合特征选择；L2正则化（岭回归）则让系数趋于相等，提供更稳定的模型。两者在处理噪声特征和关联特征时表现出不同特性。

摘要由CSDN通过智能技术生成

1、概述

通过对损失函数(即优化目标)加入惩罚项，使得训练求解参数过程中会考虑到系数的大小，通过设置缩减系数(惩罚系数)，会使得影响较小的特征的系数衰减到0，只保留重要的特征。常用的缩减系数方法有lasso(L1正则化)，岭回归(L2正则化)。
关于L1,L2正则化讲解：http://blog.csdn.net/wsj998689aa/article/details/39547771
http://blog.csdn.net/jinping_shi/article/details/52433975

2、正则化的目的

(1) 消除噪声特征
如果模型考虑了一些不必要的特征，那么这些特征就算是噪声。噪声是没必要的，使得模型复杂，降低模型准确性，需要剔除。
(2) 消除关联的特征
如果模型的特征空间中存在关联的特征，这会使得模型不适定，即模型参数会有多解。训练得到的只是其中一个解，这个解往往不能反映模型的真实情况，会误导模型的分析与理解。训练求解的模型参数受样本影响特别大，样本变化一点点，参数解就跳到另一组解去了。总之，模型是不稳定的。

3、正则化模型

正则化就是把额外的约束或者惩罚项加到已有模型（损失函数）上，以防止过拟合并提高泛化能力。损失函数由原来的E(X,Y)变为E(X,Y)+lamda||β||，w是模型系数组成的向量（有些地方也叫参数parameter，coefficients）ÿ

最低0.47元/天解锁文章

开开_王子

关注

2
点赞
踩
36

收藏

觉得还不错? 一键收藏
1
评论
特征缩减技术(shrinkage): lasso和岭回归

1、概述通过对损失函数(即优化目标)加入惩罚项，使得训练求解参数过程中会考虑到系数的大小，通过设置缩减系数(惩罚系数)，会使得影响较小的特征的系数衰减到0，只保留重要的特征。常用的缩减系数方法有lasso(L1正则化)，岭回归(L2正则化)。关于L1,L2正则化讲解：http://blog.csdn.net/wsj998689aa/article/details/395477712、正则化的目的
复制链接

扫一扫

专栏目录