机器学习笔记04：逻辑回归(Logistic regression)、分类(Classification)

最新推荐文章于 2025-02-08 12:20:49 发布

原创

最新推荐文章于 2025-02-08 12:20:49 发布 · 1.3w 阅读

32 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #逻辑回归 #分类 #梯度下降

之前我们已经大概学习了用线性回归（Linear Regression）来解决一些预测问题，详见：
1.《机器学习笔记01：线性回归(Linear Regression)和梯度下降(Gradient Decent)》
2.《机器学习笔记02：多元线性回归、梯度下降和Normal equation》
3.《机器学习笔记03：Normal equation及其与梯度下降的比较》

说明：本文章所有图片均属于Stanford机器学课程，转载请注明出处

面对一些类似回归问题，我们可以通过线性回归方法来拟合一个函数，以此来预测数据，但它的输出是连续的。有时候呢，我们需要一种方法给出一个判定结果，例如”同意(agree)”、”不同意(disagree)”。、下面呢就是关于这个方法的新内容，叫做分类(Classification)问题。又例如，如果我们需要预测一辆汽车是好的还是坏的，只有两种结果：好、坏。这种输出为0或者1的问题，就叫做分类问题，而我们对应与此种问题所采用的方法即是逻辑回归(Logistic regression)。

1.分类及其表示(Classification and Representation)

i.分类(Classification)

首先来看看分类(Classification)问题，在第一段中已经简单介绍了什么是分类问题，下面再来举几个例子：

Examples	Purposes
Email	Spam / Not Spam?
Online Transaction	Fraudulent (Yes / No?)
Tumor	Malignant / Benign?

第一个例子是判断垃圾邮件，对一封邮件，我们需要判断它是否为垃圾邮件；第二个例子是在线交易，我们需要判断这个交易是否有欺诈的嫌疑；最后一个例子是肿瘤评估，我们需要对一个病人的病情进行综合分析，来判断肿瘤是恶性的还是良性的。

详细地，我们以肿瘤评估为例。我们有如下图所示的一些样本，其横坐标表示肿瘤的大小，纵坐标表示性态（良性还是恶性）：

假设我们用一条直线

hθ(x)=θTX $h_\theta(x)=\theta^TX$ 来拟合这些数据，其图像可能大致如下：
这里写图片描述

如上图所示，

hθ(x) $h_\theta(x)$ 为紫色的直线，如果我们选择

0.5 $0.5$ 作为一个基准点来判断一个肿瘤是良性还是恶性的:

I f h θ (x) \geq 0.5, p r e d i c t " y = 1 "

$If\quad h\theta(x) \ge 0.5 \quad,predict\quad "y=1"$

I f h θ (x) < 0.5, p r e d i c t " y = 0 "

$If\quad h\theta(x) < 0.5 \quad,predict\quad "y=0"$ 那么对于上面的数据，看起来好像还不错。但是我们增加一组额外的样本来看看：
这里写图片描述

如上图所示，我们增加了一组数据，通过 线性回归（Linear Regression）得到了一条蓝色的直线，但是其看起有点不那么理想，例如有几个恶性肿瘤，也会被分类为良性肿瘤。所以，在分类问题中， 线性回归通常不是一个很好的办法。所以我们需要使用 逻辑回归(Logistic regression)来解决分类问题。逻辑回归是一个 分类算法(classification algorithm)在逻辑回归中，我们要求

0≤hθ(x)≤1 $0\le h_\theta(x) \le 1$ ，下面我们就来看看逻辑回归的假设函数。

ii.假设函数(Hypothesis)

上面我们提到了，在只有两种结果的分类问题中，它的输出不是 $0$ 即是 $1$ ，所以我们想要将分类器(classifier)的输出控制在 $[0,1]$ 上。在线性回归中，我们的假设函数为 $h_\theta(x) = \theta^TX$ ，显然其输出并不只限于区间 $[0,1]$ ，所以线性回归中的假设函数在逻辑回归(Logistic regression)中是不合适的。这里我们使我们的假设函数为：