正则化和最大后验估计(MAP)

最新推荐文章于 2023-05-18 21:56:34 发布

一条长直线

最新推荐文章于 2023-05-18 21:56:34 发布

阅读量1k

点赞数

分类专栏：数据分析文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47206104/article/details/119770439

版权

正则化

前提

$y = k x + b$
拟合结果 $f(w)=w^Tx$
运用最小二乘法得到损失函数 $L=\sum^N_{i=1}||w^Tx_i-y_i||^2$
对损失函数求导可得 $w=(X^TX)^{-1}X^TY$

由于 $X^TX$ 有可能是不可逆矩阵，因此发成可能有无数多个解，很容易造成过拟合。

处理过拟合的方法

增加数据量
减小模型复杂度：典型的是对特征进行处理
- 例如：特征的选择、特征提取(PCA)、通过方差（方差大通常来说数据的波动大，有效信息更多）、p值
正则化

$w=argmin[L(w)+\lambda P(w)]=argminJ(w)$ $\lambda>0$

注： $L (w)$ 为原损失函数， $P (w)$ 可理解为惩罚函数， $\lambda$ 为正则化参数， $\lambda P(w)$ 为正则项

$L^1$ 正则化 (Lasso回归，套索回归)

$L^1$ 正则化通过让原目标函数加上了所有特征系数绝对值的和来实现正则化

$P(w)=||w||_1=\sum^m_{i=1}|w_i|$

$L^2$ 正则化 ( Ridge回归，岭回归)

$L^2$ 正则化通过让原目标函数加上了所有特征系数的平方和来实现正则化。

$P(w)=||w||^2_2=\sum^N_{i=1}w_i^2$ → $w^Tw$

$L(w)+\lambda P(w)$

$=L(w)+\lambda w^Tw$

$J(w)'=L(w)'+(\lambda w^Tw)'$

$=X^TXW+X^TXW-X^TY-X^TY+2\lambda IW$

$=2X^TXW-2X^TY+2\lambda IW$

$= 0$

$w=(X^TX+\lambda I)^{-1}X^TY$

最低0.47元/天解锁文章

一条长直线

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
正则化和最大后验估计(MAP)

正则化前提y=kx+by=kx+by=kx+b拟合结果f(w)=wTxf(w)=w^Txf(w)=wTx运用最小二乘法得到损失函数L=∑i=1N∣∣wTxi−yi∣∣2L=\sum^N_{i=1}||w^Tx_i-y_i||^2L=∑i=1N∣∣wTxi−yi∣∣2对损失函数求导可得 w=(XTX)−1XTYw=(X^TX)^{-1}X^TYw=(XTX)−1XTY由于XTXX^TXXTX有可能是不可逆矩阵，因此发成可能有无数多个解，很容易造成过拟合。处理过拟合的方法
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。