逻辑回归的通俗解释

最新推荐文章于 2023-09-10 22:06:50 发布

weixin_33939843

最新推荐文章于 2023-09-10 22:06:50 发布

阅读量1.1k

点赞数

文章标签：数据结构与算法人工智能

1 逻辑回归的定位

首先，逻辑回归是一种分类（Classification）算法。比如说：

给定一封邮件，判断是不是垃圾邮件
给出一个交易明细数据，判断这个交易是否是欺诈交易
给出一个肿瘤检查的结果数据，判断这个肿瘤是否为恶性肿瘤

逻辑回归是互联网上最流行也是最有影响力的分类算法，也是深度学习（Deep Learning）的基本组成单元。

2 先给出一个逻辑回归的例子

比如有下面一组数据：
一门考试之前学生的复习时间与这个学生最后是否Pass这门考试的数据

数据：学生复习时间与考试通过

通过这些数据，利用逻辑回归算法进行模型训练，可以得到最终的模型结果是这个样子：

logistic equation

这样，给出任何复习时间，就可以预测出是否通过的概率

模型应用

3 逻辑回归拟合函数：Sigmod函数（逻辑函数）

可以看到，逻辑回归最后的分类结果是0/1，因此，我们选择Sigmod函数（貌似是一个专业术语）来拟合训练数据。Sigmod函数的形式如下，它的x可以无限取值，但是y就在（0，1）之间

Sigmod函数

对于最简单的，只有一个自变量（x）的二元分类（y=0/1）逻辑回归中，构造出来的拟合函数为

最简单的逻辑回归拟合函数

所以，要得到最终的模型，就是根据样本点，计算a和b的值.

在上一节的复习时间和考试的例子中，最终计算出参数a=1.5046，b=-4.0777，因此可以得到下面的拟合函数的图像：

模型的图像

4 模型参数的计算方法

Coursera上Stanford大学的机器学习课程是很好的入门课程（虽说入门，但是我学习起来还是特别的吃力），主讲人Andrew Ng（吴恩达）原来是Google大脑的负责人，现在在百度负责百度大脑和深度学习，是业界最牛的人之一了。他的课程中详细讲解了在逻辑回归中如何来计算模型的参数，我把结论的一页截图放在下面：

Coursera上Stanford的机器学习课程截图

其中，J就是进行拟合的成本函数：

Cost Function

看起来比较复杂，用我们上一节的例子来解释：

m：代表给出的训练样本数，也就是20
h函数：其实代表的是我们的Sigmoid函数，把样本的X值带进去，就得到的是参数a，b的函数
y：就是样本中实际的y，只有0，1两个选择

把样本的数据都带入，最后得到的就是参数a，b的一个方程，逻辑回归就是求出一个最好的a，b的值，使得这个成本函数J的值最小。
那么，最终求解a和b就是一个纯数学问题了，比如可以用最小二乘法和梯度下降法来求解，纯数学的问题就不在这里展开了

5 多分类逻辑回归

生活中不仅仅只有分成两类的问题，还有分成多个类的问题，比如把邮件分成工作邮件、朋友邮件和垃圾邮件。
多分类的一般思想是：利用多次分成两类，计算划分到每一类的概率，取概率最大的。用邮件分类的例子来说就是：

将邮件分成“工作/非工作邮件”，可以根据上文的算法得出工作邮件的概率
将邮件分成“朋友/非朋友邮件”，计算出朋友邮件的概率
将邮件分成“垃圾/非垃圾邮件”，计算出垃圾邮件的概率

比较三个概率，取最大的那个概率，作为这个邮件的分类结果。

---------------------------------------------------------------------------------------------------------------------------------------------
作者：程sir
链接：http://www.jianshu.com/p/31f41fa694e8
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

weixin_33939843

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归的通俗解释

1 逻辑回归的定位首先，逻辑回归是一种分类（Classification）算法。比如说：给定一封邮件，判断是不是垃圾邮件给出一个交易明细数据，判断这个交易是否是欺诈交易给出一个肿瘤检查的结果数据，判断这个肿瘤是否为恶性肿瘤逻辑回归是互联网上最流行也是最有影响力的分类算法，也是深度学习（Deep Learning）的基本组成单元。2 先给出一个逻辑回归的例子比如有下面一组数据：...
复制链接

扫一扫