吴恩达机器学习视频第五第六部分

最新推荐文章于 2024-07-20 17:45:23 发布

我在阳澄湖畔吃炸鸡

最新推荐文章于 2024-07-20 17:45:23 发布

阅读量51

点赞数

分类专栏：吴恩达机器学习 AI 文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/smy166153/article/details/116794500

版权

AI 同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

吴恩达机器学习

3 篇文章 0 订阅

订阅专栏

文章目录

前言
一、逻辑回归
二、过拟合问题

前言

吴恩达机器学习第五第六部分

一、逻辑回归

1.介绍

分类问题，希望分类器的输出值在 0 和 1 之间，因此，假设函数需要满足预测值要在 0 和 1 之间。

回归模型的假设是:
$h_\theta(x)=g(\theta^TX)$
g 代表逻辑函数（logistic function）, 是一个常用的逻辑函数为 S 形函数（Sigmoid function），公式为:
$g(z)=\frac{1}{1+e^{-z}}$
其图像为

在这里插入图片描述
结合起来逻辑回归的假设为：
$h_\theta(x)=\frac{1}{1+e^{\theta^TX}}$
我们根据概率大小来进行分类，当概率大于0.5则必然是概率大的一方，所以我们预测当 $h_\theta(x)>0.5$ 时 $y = 1$ ,当 $h_\theta(x)<0.5$ 时 $y = 0$
所以当 $\theta^TX>0$ 时预测 $y = 1$ , 当 $\theta^TX<0$ 预测 $y = 0$

2.代价函数

我们可以得出
$P(y=1|x)=h_\theta(x)$ $P(y=0|x)=1-h_\theta(x)$ 我们可以求得其最大似然函数: $L(\theta)=\prod h_\theta(x^i)^{y_i}(1-h_\theta(x^i))^{1-y_i}$ 取对数可得: $L(\theta)=\sum (y_ih_\theta(x^i)+(1-y_i)(1-h_\theta(x^i))$ 由于在逻辑回归中最大似然函数和最小损失函数是等价的，所以我们可得损失函数为： $J(\theta)=-\frac{1}{n}\sum (y_ih_\theta(x^i)+(1-y_i)(1-h_\theta(x^i))$

3.梯度下降

梯度下降的公式为： $\theta_j=\theta_j-\alpha \frac{\partial}{\partial \theta_j}J(\theta)$ 经推导可得： $\theta_j=\theta_j-\alpha \frac{1}{n}\sum(h_\theta(x^i)-y_i)x^i_j$

二、过拟合问题

所谓过拟合（over-fitting）其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在验证数据集以及测试数据集中表现不佳。
解决过拟合问题有如下方案：

1. 丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙（例如 PCA, LDA），缺点是丢弃特征的同时，也丢弃了这些相应的信息；

2.正则化。 保留所有的特征，但是减少参数的大小（magnitude），当我们有大量的特征，每个特征都对目标值有一点贡献的时候，比较有效。

3.还有一个解决方式就是增加数据集, 因为过拟合导致的原因就过度拟合测试数据集, 那么增加数据集就很大程度提高了泛化性了.

1.正则化

高次项导致了过拟合的产生。

正则化的基本方法：对高次项添加惩罚值，让高次项的系数接近于0。

假如我们有非常多的特征，我们并不知道其中哪些特征我们要惩罚，我们将对所有的特征进行惩罚，并且让代价函数最优化的软件来选择这些惩罚的程度。这样的结果是得到了一个较为简单的能防止过拟合问题的假设： $J(\theta)=\frac{1}{2m}[\sum_{i=1}^{m}(h_\theta(x^i)-y^i)^2+\lambda \sum_{j=1}^n\theta_j]$ 其中 $\lambda$ 又称为正则化参数（Regularization Parameter）。注：根据惯例，我们不对 $\theta_0$ 进行惩罚。

2.正则化与线性回归

线性回归函数的正则化如上节所写
其中梯度下降递推式为： $\theta_j=\theta_j(1-\alpha\frac{\lambda}{m})-\alpha \frac{1}{m}\sum(h_\theta(x^i)-y_i)x^i_j$
其中正规方程为： $\theta=(X^TX+ \lambda A)^{-1}X^Ty$
其中A为将n阶单位矩阵最左上角的数替换为0（这个阵我打不出来，呜呜呜）

3.正则化与逻辑回归

逻辑回归的正则化可有下面的一种 $J(\theta)=-\frac{1}{m}\sum (y_ih_\theta(x^i)+(1-y_i)(1-h_\theta(x^i))+\frac{1}{2m}\sum_{j=1}^n\theta^2_j$
常用的正则化方式还有L1正则化和L2正则化，详细请看https://zhuanlan.zhihu.com/p/74874291

[1]吴恩达机器学习视频
[2]https://mo.zju.edu.cn/workspace/5f6038a891b86ce2f6e7a418/app
[3]https://zhuanlan.zhihu.com/p/74874291

我在阳澄湖畔吃炸鸡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习视频第五第六部分

文章目录前言一、逻辑回归1.介绍2.代价函数3.梯度下降二、过拟合问题1.正则化2.正则化与线性回归3.正则化与逻辑回归前言吴恩达机器学习第五第六部分一、逻辑回归1.介绍分类问题，希望分类器的输出值在 0 和 1 之间，因此，假设函数需要满足预测值要在 0 和 1 之间。回归模型的假设是:hθ(x)=g(θTX)h_\theta(x)=g(\theta^TX)hθ(x)=g(θTX)g 代表逻辑函数（logistic function）, 是一个常用的逻辑函数为 S 形函数（Sigmoi
复制链接

扫一扫

专栏目录