吴恩达机器学习第六章学习笔记

最新推荐文章于 2022-09-06 15:48:10 发布

一晚好梦

最新推荐文章于 2022-09-06 15:48:10 发布

阅读量292

点赞数

分类专栏：吴恩达机器学习学习笔记文章标签：机器学习

本文链接：https://blog.csdn.net/yiwanhaomeng/article/details/104033056

版权

吴恩达机器学习学习笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

逻辑回归（logistic regression）

逻辑回归算法实际是分类算法。

二元分类问题（binary classification problem）

在这里插入图片描述
如上图，这是一个判断肿瘤恶性值的二元分类问题，我们画出了如粉线所示的线性回归图像，设阈值为0.5，若 $h_\theta^{(x)}>0.5$ 则被归类于 $y = 1$ , $h_\theta^{(x)}<0.5$ 则被归类于 $y = 0$ 。但 $h_\theta^{(x)}$ 可以大于1，也可以小于0，并且可以看出线性回归拟合数据不是很好，同时我们也可以画出除粉线之外的其他线性回归图像，所以线性回归不能很好解决分类问题。

逻辑回归的假设函数（逻辑函数或S型函数）

（ps：这里的 $\theta$ 、 $x$ 都代表矩阵或向量）
由前面的学习我们知道了线性回归的假设函数： $h_\theta^{(x)}=\theta^{T}x$ ，而由二元分类我们可以得出我们需要的模型的取值范围应该在0和1之间。逻辑函数为： $h_\theta^{(x)}=\frac{1}{1+e^{-{\theta^T}x}}$ 。推导过程如下：
在这里插入图片描述
图像为：

决策边界（decision boundary）

在这里插入图片描述
由上图可知，当 $h_\theta^{(x)}$ （或 $g (z)$ ）大于0.5时我们预测y=1， $h_\theta^{(x)}$ （或 $g (z)$ ）小于0.5时，我们预测y=0。即z>0时，预测y=1，z<0时，预测y=0，即 $\theta^Tx$ >0时，预测y=1， $\theta^Tx$ <0时，预测y=0。
由此我认为决策边界是由参数决定的区分数据的图像，如下图的粉线所示：
在这里插入图片描述

逻辑回归的代价函数

在这里插入图片描述
我们知道代价函数是这样表示的： $J(\theta)=\frac{1}{m}\sum_{i=1}^{m}\frac{1}{2}(h_\theta^{(x^{i})}-y^{(i)})^2$ （ $\frac{1}{2}$ 移到了求和符号里面）， $cost(h_\theta^{(x^{(i)})},y^{(i)})=\frac{1}{2}(h_\theta^{(x^{i})}-y^{(i)})^2$ ，则 $J(\theta)=\frac{1}{2}\sum_{i=1}^{m}cost(h_\theta^{(x^{(i)})},y^{(i)})$ 如果 $cost(h_\theta^{(x^{(i)})},y^{(i)})$ 使用平方差公式表示，那么我们画出代价函数与参数的图像（如下图所示），可以看出这是一个非凸函数的图像：
在这里插入图片描述
这明显看出不利于找出最优点，因此我们如果想得到一个凸函数图像，那么 $cost(h_\theta^{(x^{(i)})},y^{(i)})$ 就不能使用上面的平方差公式，我们令 $cost(h_\theta^{(x^{(i)})},y^{(i)})$ 如下：

图像如下：

这是一个凸函数图像，可以找出最优点，
$cost(h_\theta^{(x^{(i)})},y^{(i)})$ 的图像如下（因为 $cost(h_\theta^{(x^{(i)})},y^{(i)})$ 的公式是分情况讨论的，所以图像也是如此）：
在这里插入图片描述

由 $cost(h_\theta^{(x^{(i)})},y^{(i)})$ 的公式，我们能推出以下性质：

我们已经知道了分情况讨论的 $cost(h_\theta^{(x^{(i)})},y^{(i)})$ ，那么我们也可以合并两种情况：

代价函数求下导得：

虽然逻辑回归的梯度求导算法与线性回归的梯度求导算法看着相似，但实际上这是两种不同的算法，因为假设函数发生了变化。