吴恩达深度学习公开课笔记(3)

最新推荐文章于 2024-07-18 14:23:57 发布

QzMate

最新推荐文章于 2024-07-18 14:23:57 发布

阅读量166

点赞数 1

分类专栏：深度学习文章标签：吴恩达

本文链接：https://blog.csdn.net/weixin_43163254/article/details/90229326

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

如何解决过拟合问题

尽量减少特征变量:
- 人工选择
- 模型选择算法
正规化:
- 保存所有特征，但减少参数 $\theta_j$ 的值
- 当我们有许多特征时能工作的很好

什么是过拟合

在这里插入图片描述

正规化

优化目标：
在这里插入图片描述
加上一些项(1000只是一个随意的很大的数)：

$\theta_3和\theta_4对代价函数的影响巨大$
如果我们要最小化代价函数，那么 $\theta_3$ 和 $\theta_4$ 就会尽可能小
新的代价函数将会导致:
$\theta_3\approx0, \theta_4\approx0$ 就像我们忽略了 $\theta_3$ 和 $\theta_4$

在这里插入图片描述

正规化背后的思路

如果我们的参数对应一个较小值的话，更简单的参数会参数更平滑的函数

更简单的假设
不会产生过拟合

代价函数

当特征很多时:

Features： $x_1,x_2,\dots,x_{100}$
Parameters： $\theta_0,\theta_1,\theta_2,\dots,\theta_{100}$

我们不知道怎么选择参数

在正规化在我们要做的就是惩罚所有参数：

$J_{\theta}(\theta)= \lbrack\frac{1}{2m}\sum_{i=1}^{m}(h(x^{(i)})-y^{(i)})+\lambda\sum_{j=i}^{n}\theta_{j}^{2}\rbrack$

按照惯例来说不会惩罚 $\theta_0$

$\lambda$ 在这里叫做正规化参数， $\lambda$ 要做的就是控制在两个不同目标间的平衡关系：
平衡拟合目标(平方误差)和保持较小参数的目的
从而保持假设更简单，来避免过拟合

如果 $\lambda$ 过大会导致欠拟合

$h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_3+\theta_4x_4$
如果 $\lambda$ 过大，那么参数将会尽可能小：
$\theta_1\approx0,\theta_2\approx0,\theta3\approx0,\theta_4\approx0$
相当于拟合了直线：
$h_\theta(x)=\theta_0$

偏导：
$线性回归：J(\theta)'=\frac{1}{m}\sum_{i=1}^{M}(H(x^{(i)})-y^{(i)})x_j^{(i)}+2\lambda\theta_{j}\\ 逻辑回归：J(\theta)'=\frac{1}{m}\sum_{i=1}^{M}(H(x^{(i)})-y^{(i)})x_j^{(i)}+\frac{\lambda}{m}\theta_j$