【机器学习】逻辑回归

最新推荐文章于 2022-01-28 10:52:48 发布

Louis1874

最新推荐文章于 2022-01-28 10:52:48 发布

阅读量304

点赞数 2

分类专栏： # 机器学习文章标签：机器学习人工智能深度学习算法 matlab

本文链接：https://blog.csdn.net/weixin_44413191/article/details/107784688

版权

本文为机器学习的学习笔记，讲解逻辑回归模型。

分类

分类问题是一种典型的无监督学习，其典型案例在【什么是机器学习】中已经介绍。

对于预测值 y，0 和 1 的设置是任意的。我们通常用 0 表示没有某个东西，用 1 表示有。如果 y 有多个取值： $y\in\{0,1,2,3\}$ ，则称为多分类问题。

这是一个肿瘤预测的例子，我们【线性回归】的方法运用其中，用直线拟合。如果想要分类，可以将分类器的阈值设置为 0.5，即纵坐标值为 0.5：

这貌似是可行的。但是当我们加入另一个预测点时，直线变为蓝色直线：

在这里插入图片描述

在蓝色竖线左边的值都会被判断为良性肿瘤，但这并不符合恶性肿瘤的前两个样本点。并且当使用线性回归模型时，计算出的预测值会远大于 1 或远小于 0，这是不符合常理的。因此我们通常不用线性回归来解决分类问题。我们将会讲到 logisitic 回归算法，其输出值在 0 到 1 之间，是一种分类算法。

假设陈述

对于 logistics 回归模型，假设函数与线性回归模型相似：
$h_\theta(x)=g(\theta^Tx)$
我们想让 $h_\theta(x)$ 的输出值在 0 和 1 之间，定义 $g$ 如下：
$g(z)=\frac{1}{1+e^{-z}}$
称为 Sigmoid 函数或 Logistic 函数，这两个术语可以互换。则此时：
$h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}$
函数图像为：

当假设函数输出一个值时，其含义是：对于一个输入 $x$ ， $y = 1$ 的概率估计。例如一个病人用 logistics 回归模型预测出的值为 0.7，意味着：给定参数 $\theta$ ，对于特征为 $x$ 的病人，有 70% 的可能是恶性肿瘤。写成数学表达式为：
$h_\theta(x)=P(y=1|x;\theta)$
我们用 1 减去这个值就是 $y = 0$ 的概率了。条件概率相关内容参考《概率论与数理统计》