python和机器学习第八章多项式回归与模型泛化（五）偏差方差平衡；模型正则化之岭回归、LASSO

最新推荐文章于 2023-08-02 16:45:01 发布

把小兔打哭

最新推荐文章于 2023-08-02 16:45:01 发布

阅读量629

点赞数

分类专栏： python与机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/Dear_leslie/article/details/96282173

版权

本文探讨了模型误差的组成，包括偏差、方差和不可避免的误差，并提出了降低模型复杂度、减少维度、增加样本数量和使用验证集等解决高方差的方法。重点讲解了模型正则化的概念，通过限制参数大小来减少方差。介绍了岭回归，其通过调整alpha值控制模型复杂度，但计算量较大且不具备特征选择功能。接着讨论了LASSO，它能促使部分参数变为0，适用于特征选择。最后提到了弹性网络，它是岭回归和LASSO的结合，可通过调整比例r实现不同正则化效果。

摘要由CSDN通过智能技术生成

模型误差 = 偏差(Bias) + 方差(Variance) + 不可避免地误差

方差	偏差
数据的一点点扰动都会较大地影响模型	–
导致原因：使用的模型过于复杂	导致原因：对问题本身的假设不正确
如：使用高阶多项式回归	如：非线性数据使用线性回归
过拟合	欠拟合
非参数学习通常都是高方差算法。如：KNN	参数学习通常都是高偏差算法。如：线性回归

解决高方差的通常手段：

降低模型复杂度
减少数据维度；降噪
增加样本数量
使用验证集
模型正则化

模型正则化

限制参数（系数）的大小
经过正则化后，得到的模型的方差会大大减小

岭回归

1、为了防止过拟合，加入theta
2、alpha取不同的值，可以控制theta在函数J中所占的比例
3、alpha越大，曲线越平滑
4、岭回归不具有特征选择的能力，计算量会比较大

In [138]: from sklearn.linear_model import Ridge
     ...: 
     ...: def RidgeRegression(degree,alpha):
     ...:     return Pipeline([
     .

最低0.47元/天解锁文章

把小兔打哭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python和机器学习 第八章 多项式回归与模型泛化（五）偏差方差平衡；模型正则化之岭回归、LASSO

模型正则化

python和机器学习第八章多项式回归与模型泛化（五）偏差方差平衡；模型正则化之岭回归、LASSO