线性回归&逻辑回归的区别于联系

最新推荐文章于 2023-12-08 15:07:35 发布

Catherine-HFUT

最新推荐文章于 2023-12-08 15:07:35 发布

阅读量413

点赞数 1

分类专栏：动手学深度学习文章标签：自然语言处理机器学习深度学习

本文链接：https://blog.csdn.net/m0_45373271/article/details/107756807

版权

动手学深度学习专栏收录该内容

7 篇文章 1 订阅

订阅专栏

线性回归

线性回归算法。顾名思义具有线性特性。它能够预测序列数据，比如根据房屋面积和售价俩个特征在坐标轴上标点，试图找到一条拟合曲线，拟合数据，等到要预测房价时就可以根据曲线做出相应的预测。——连续值预测
eg:这个例子是预测住房价格的，我们要使用一个数据集，数据集包含俄勒冈州波特兰市的住房价格。在这里，我要根据不同房屋尺寸所售出的价格，画出我的数据集。比方说，如果你朋友的房子是1250平方尺大小，你要告诉他们这房子能卖多少钱。那么，你可以做的一件事就是构建一个模型，也许是条直线，从这个数据模型上来看，也许你可以告诉你的朋友，他能以大约220000(美元)左右的价格卖掉这个房子。这就是监督学习算法的一个例子。
在这里插入图片描述它被称作监督学习是因为对于每个数据来说，我们给出了“正确的答案”，即告诉我们：根据我们的数据来说，房子实际的价格是多少，而且，更具体来说，这是一个回归问题。回归一词指的是，我们根据之前的数据预测出一个准确的输出值，对于这个例子就是价格，同时，还有另一种最常见的监督学习方式，**叫做分类问题，当我们想要预测离散的输出值，例如，我们正在寻找癌症肿瘤，并想要确定肿瘤是良性的还是恶性的，**这就是0/1离散输出的问题。

逻辑回归

在分类问题中，要预测的变量 y 是离散的值，其中一种方法叫做逻辑回归 (Logistic Regression) 的算法，这是目前最流行使用最广泛的一种学习算法。

在分类问题中，**我们尝试预测的是结果是否属于某一个类（例如正确或错误）。**分类问题的例子有：判断一封电子邮件是否是垃圾邮件；判断一次金融交易是否是欺诈；之前我们也谈到了肿瘤分类问题的例子，区别一个肿瘤是恶性的还是良性的。
eg：
二元分类问题

我们将因变量(dependent variable)可能属于的两个类分别称为负向类（negative class）和正向类（positive class），则因变量y∈ { 0,1 }，其中 0 表示负向类，1 表示正向类。
它的输出值永远在0到 1 之间。

逻辑回归算法是分类算法，它适用于标签 y 取值离散的情况，如：1 0 0 1。乳腺癌分类问题，肿瘤大小，是否患有乳腺癌
在这里插入图片描述
那么线性方法为何不适用呢？我们可以用线性回归的方法求出适合数据的一条直线（红色直线）：根据线性回归模型我们只能预测连续的值，然而对于分类问题，我们需要输出0或1，我们可以预测：

当 ${h_\theta}\left( x \right)>=0.5$ 时，预测 $y = 1$ 。

当 ${h_\theta}\left( x \right)<0.5$ 时，预测 $y = 0$ 。

对于上图所示的数据，这样的一个线性模型似乎能很好地完成分类任务。假使我们又观测到一个非常大尺寸的恶性肿瘤，将其作为实例加入到我们的训练集中来，这将使得我们获得一条新的直线（蓝色直线）。这时，再使用0.5作为阀值来预测肿瘤是良性还是恶性便不合适了。可以看出，线性回归模型，因为其预测的值可以超越[0,1]的范围，并不适合解决这样的问题。