机器学习中对过拟合的正则化策略

最新推荐文章于 2024-07-18 17:30:53 发布

Mr.Huang Tony

最新推荐文章于 2024-07-18 17:30:53 发布

阅读量137

点赞数

分类专栏：机器学习文章标签：过拟合正则化逻辑回归

本文链接：https://blog.csdn.net/weixin_42036617/article/details/104181811

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Hello，大家好，我是Tony:

欢迎访问我的个人主页：Tony’s blog，让我们一起站在巨人的肩膀上。

在这里插入图片描述
上一张男神的照片，该笔记配合Andrew Ng课程Maching Learning 课时7-1至7-4

对于过拟合的建议

1、减少特征的数量

这里要说明一点对于一类数据，它的拟合数据为：
$y=\theta_0+\theta_1*x_1+\theta_2*x_1^2+\theta_3*x_1^3+...+\theta_n*x_1^n$
这里描述的拟合曲线只是一个特征x1！
$y=\theta_0+\theta_1*x_1+\theta_2*x_1^2+\theta_3*x_1^3+...+\theta_n*x_1^n\\+\theta_0'+\theta_1'*x_2+\theta_2'*x_2^2+\theta_3'*x_2^3+...+\theta_n'*x_2^n\\+\theta_0''+\theta_1''*x_3+\theta_2''*x_3^2+\theta_3''*x_3^3+...+\theta_n''*x_3^n$
这里描述的拟合曲线是个3特征x1、x2、x3！

手动选择数量合适的特征
模型选择算法

2.正则化

保留所有特征并减少参数theta的大小
当我们有很多特征时效果很好，每个特征都对y的预测有所帮助；

对于过拟合的具体做法

$\lambda \sum_{j=1}^{n} \theta_{j}^{2}$

$J(\theta)=\frac{1}{2 m}\left[\sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)^{2}+\lambda \sum_{j=1}^{n} \theta_{j}^{2}\right]$

lambda 是正则化参数

1、线性回归正则化的具体做法：

i.梯度下降算法

Repeat:

{

Before:
$\theta_{0}:=\theta_{0}-\alpha \frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right) x_{0}^{(i)}$
Later:

在这里插入图片描述
$\theta_{j}:=\theta_{j}\left(1-\alpha \frac{\lambda}{m}\right)-\alpha \frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right) x_{j}^{(i)}$
}

ii.正则化方程算法

在这里插入图片描述

2、逻辑回归正则化的具体做法

Before
$J(\theta)=-\left[\frac{1}{m} \sum_{i=1}^{m} y^{(i)} \log h_{\theta}\left(x^{(i)}\right)+\left(1-y^{(i)}\right) \log \left(1-h_{\theta}\left(x^{(i)}\right)\right)\right]$
====>>
$J(\theta)=-\frac{1}{m}\left[\sum_{i=1}^{m} y^{(i)} \log h_{\theta}\left(x^{(i)}\right)+\left(1-y^{(i)}\right) \log \left(1-h_{\theta}\left(x^{(i)}\right)\right)\right]+\frac{\lambda}{2 m} \sum_{j=1}^{n} \theta_{j}^{2}$

i.梯度下降算法

Repeat

{

Before:
$\theta_{j}:=\theta_{j}-\alpha \frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right) x_{0}^{(i)}$
Later:
$\theta_{j}:=\theta_{j}-\alpha\left[\frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right) x_{j}^{(i)}+\frac{\lambda}{m} \theta_{j}\right]$

}

ii.一些高级优化算法（Advanced Algorithm）

function [jVal,gradient]=costFunction(theta)

在这里插入图片描述

Mr.Huang Tony

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习中对过拟合的正则化策略

Hello，大家好，我是Tony:欢迎访问我的个人主页：Tony’s blog，让我们一起站在巨人的肩膀上。上一张男神的照片，该笔记配合Andrew Ng课程Maching Learning 课时7-1至7-4对于过拟合的建议1、减少特征的数量这里要说明一点对于一类数据，它的拟合数据为：y=θ0+θ1∗x1+θ2∗x12+θ3∗x13+...+θn∗x1ny=\theta_0+\...
复制链接

扫一扫