线性回归和逻辑分类的正则化

最新推荐文章于 2023-03-30 15:33:54 发布

少爷想养猫

最新推荐文章于 2023-03-30 15:33:54 发布

阅读量194

点赞数

分类专栏：机器学习文章标签：正则化

本文链接：https://blog.csdn.net/weixin_44180216/article/details/90480035

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

线性回归的正则化

假设

$h_{\theta}\left( \boldsymbol{x} \right) =\boldsymbol{\theta }^T\boldsymbol{x}=\theta _0x_0+\theta _1x_1+\theta _2x_2+\cdots +\theta _nx_n$

代价函数

$J\left( \boldsymbol{\theta } \right) =\frac{1}{2m}\left[ \sum_{\,\,i\,\,=1}^m{\left( h_{\theta}\left( \boldsymbol{x}^{\left( i \right)} \right) -y^{\left( i \right)} \right) ^2}+\lambda \sum_{j=1}^n{\theta _j^2} \right]$
加入了限制 $\theta_j$ 大小的时候的惩罚项，使各个 $\theta_j$ 不会太大，这样有利于防止过拟合。

梯度下降法

$\theta _j\,\,:=\,\,\theta _j-\alpha \frac{\partial}{\partial \theta _j}J\left( \boldsymbol{\theta } \right) \,\, \left( j=\text{0,1,2,3 }\dots n \right) \\ \begin{cases} \theta _0\,\,:=\,\,\theta _0-\,\alpha \frac{1}{m}\sum_{i=1}^m{\left( h_{\theta}\left( \boldsymbol{x}^{\left( i \right)} \right) -\text{y}^{\left( i \right)} \right) x_{0}^{\left( i \right)}}& \,\, j=0\\ \theta _j\,\,:=\,\,\theta _j-\,\alpha \frac{1}{m}\left[ \sum_{i=1}^m{\left( h_{\theta}\left( \boldsymbol{x}^{\left( i \right)} \right) -\text{y}^{\left( i \right)} \right) x_{j}^{\left( i \right)}}+\lambda \theta _j \right]& \,\, j>0\\ \end{cases}$

补充：正规方程法的正则化

$\boldsymbol{X}_{m\times \left( n+1 \right)}\,\,=\left[ \begin{array}{c} \left( x^{\left( 1 \right)} \right) ^T\\ \vdots\\ \left( x^{\left( m \right)} \right) ^T\\ \end{array} \right] ,\boldsymbol{\theta }=\left[ \begin{array}{c} \theta _0\\ \vdots\\ \theta _n\\ \end{array} \right] ,\boldsymbol{y}=\left[ \begin{array}{c} y^{\left( 1 \right)}\\ \vdots\\ y^{\left( m \right)}\\ \end{array} \right]$

$\boldsymbol{\theta }=\left( \boldsymbol{X}^T\boldsymbol{X}+\underset{\left( n+1 \right) \times \left( n+1 \right)}{\underbrace{\left[ \begin{matrix}{} 0& & & & \\ & 1& & & \\ & & 1& & \\ & & & \ddots& \\ & & & & 1\\ \end{matrix} \right] }} \right) ^{-1}\boldsymbol{X}^T\boldsymbol{y}$
加入了一个特殊的矩阵，使方程始终有解。

逻辑分类的正则化

假设

$h_{\theta}\left( \boldsymbol{x} \right) =\left( 1+e^{-\boldsymbol{\theta }^T\boldsymbol{x}} \right) ^{-1}$

代价函数

$J\left( \boldsymbol{\theta } \right) =\frac{1}{m}\sum_{i=1}^m{\text{Cost}\left( h_{\theta}\left( \boldsymbol{x}^{\left( i \right)} \right) ,y^{\left( i \right)} \right)}+\frac{\lambda}{2m}\sum_{j=1}^n{\begin{array}{c} \theta _j^2\\ \end{array}}$

也即
$J\left( \boldsymbol{\theta } \right) =\frac{1}{m}\sum_{i=1}^m{\left[ -y^{\left( i \right)}\log \left( h_{\theta}\left( \boldsymbol{x}^{\left( i \right)} \right) \right) +\left( y^{\left( i \right)}-1 \right) \log \left( 1-h_{\theta}\left( \boldsymbol{x}^{\left( i \right)} \right) \right) \right]}+\frac{\lambda}{2m}\sum_{j=1}^n{\begin{array}{c} \theta _j^2\\ \end{array}}$

梯度下降法

$\theta _j\,\,:=\,\,\theta _j-\alpha \frac{\partial}{\partial \theta _j}J\left( \boldsymbol{\theta } \right) \,\, \left( j=\text{0,1,2,3 }\dots n \right)$
推导为
$\begin{cases} \theta _0\,\,:=\,\,\theta _0-\,\alpha \frac{1}{m}\sum_{i=1}^m{\left( h_{\theta}\left( \boldsymbol{x}^{\left( i \right)} \right) -\text{y}^{\left( i \right)} \right) x_{0}^{\left( i \right)}}& \,\, j=0\\ \theta _j\,\,:=\,\,\theta _j-\,\alpha \frac{1}{m}\left[ \sum_{i=1}^m{\left( h_{\theta}\left( \boldsymbol{x}^{\left( i \right)} \right) -\text{y}^{\left( i \right)} \right) x_{j}^{\left( i \right)}}+\lambda \theta _j \right]& \,\, j>0\\ \end{cases}$

少爷想养猫

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
线性回归和逻辑分类的正则化

线性回归的正则化假设hθ(x)=θTx=θ0x0+θ1x1+θ2x2+⋯+θnxnh_{\theta}\left( \boldsymbol{x} \right) =\boldsymbol{\theta }^T\boldsymbol{x}=\theta _0x_0+\theta _1x_1+\theta _2x_2+\cdots +\theta _nx_nhθ(x)=θTx=θ0x0+...
复制链接

扫一扫