吴恩达机器学习入门笔记5-正则化

最新推荐文章于 2024-08-16 22:11:32 发布

杰斯洛兰德

最新推荐文章于 2024-08-16 22:11:32 发布

阅读量139

点赞数

分类专栏：吴恩达机器学习入门文章标签：机器学习吴恩达正则化

本文链接：https://blog.csdn.net/qq_41037703/article/details/100880928

版权

吴恩达机器学习入门专栏收录该内容

13 篇文章 0 订阅

订阅专栏

5 正则化

给参数增加惩罚项，达到简化假设函数，降低过拟合的目的

5.1 正则化线性回归

5.1.1 正则化代价函数

$J(\theta)=\frac{1}{2 m}\left[\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^{2}+\lambda \sum_{j=1}^{n} \theta_{j}^{2}\right]\tag{5.1}$

右边加的项称为正则化项， $\lambda$ 称为正则化参数，有两个目标

更好地拟合训练集
保证1的同时尽量减小参数，保持假设模型简单避免出现过拟合情况

一般约定不对 $\theta_0$ 进行正则化
若 $\lambda$ 设置过大，参数会接近于0，导致假设函数只有 $\theta_0$ 项，即假设函数是一条水平直线，因此需要选择一个合适的正则化参数

5.1.2 正则化梯度下降

$[外链图片转存失败(img-r6hfBavh-1568602397135)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\5.1.2 正则化梯度下降.png)]$

学习率 $\alpha$ 很小，样本量m很大，因此正则化即每次将参数向0方向缩小一点

5.1.3 正则化正规方程

$\theta=\left(X^{T} X+\lambda\left[\begin{array}{cccc}{0} \\ {} & {1} \\ {} & {} & {1} \\ {} & {} & {} & {\ddots} \\ {} & {} & {} & {1}\end{array}\right]\right)^{-1} X^{T} y\tag{5.2}$

其中加入的矩阵为(n+1)×(n+1)维

如果样本量m小于特征变量个数n，则 $X^TX$ 不可逆，为奇异矩阵，但只要 $\lambda>0$ ，可确保矩阵和非奇异

5.2 正则化逻辑回归

5.2.1 正则化代价函数

$\begin{aligned} J(\theta)=-[\frac{1}{m}\sum_{i=1}^{m} y^{(i)} \log h_{\theta}(x^{(i)})+(1-y^{(i)}) \log (1-h_{\theta}(x^{(i)}))]+\frac{\lambda}{2m}\sum_{j=1}^{n}\theta_j^2 \end{aligned}\tag{5.3}$

计算后一项记得从j=1开始，因为不正则化 $\theta_0$

5.2.2 正则化梯度下降

$[外链图片转存失败(img-ZzgwHxme-1568602397136)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\5.2.2 正则化梯度下降.png)]$

5.2.3 正则化高级算法

$[外链图片转存失败(img-gkcWAE8y-1568602397139)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\5.2.3 正则化高级算法.png)]$

5.3 正则化与偏差方差的关系

$[外链图片转存失败(img-Clhl2T6h-1568602397141)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\5.3 正则化与偏差方差的关系.png)]$

$\lambda$ 越大，训练集和验证集的偏差越大， $\lambda$ 越小，训练集的误差越小，验证集的方差越大

杰斯洛兰德

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习入门笔记5-正则化

5 正则化给参数增加惩罚项，达到简化假设函数，降低过拟合的目的5.1 正则化线性回归5.1.1 正则化代价函数(5.1)J(θ)=12m[∑i=1m(hθ(x(i))−y(i))2+λ∑j=1nθj2]J(\theta)=\frac{1}{2 m}\left[\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^{2}+\lambda \sum_{j=...
复制链接

扫一扫