[Machine Learning]4.逻辑回归（logistic regression）

最新推荐文章于 2019-06-15 21:51:17 发布

LiemZuvon

最新推荐文章于 2019-06-15 21:51:17 发布

阅读量943

点赞数

分类专栏：机器学习文章标签：机器学习 logistic regression 分类问题多元分类问题二元分类问题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012767526/article/details/49720333

版权

机器学习专栏收录该内容

19 篇文章 1 订阅

订阅专栏

接下来我们将从回归问题切换至分类问题。分类问题的名字logistic regression是由于历史原因，但事实上讨论的并不是用于regression问题，而是classification问题。

分类

在这时，我们的输出值y再也不是连续量，而是离散值，不是0就是1.

y=0代表反向类别，y=1代表正向类别，当然我们也可以根据自身需要给y自己的类别定义。

现在我们只讨论只有两个类别的问题，称为“二元分类问题”。

假说函数表示

根据我们前面的定义，我们的假说函数应该满足

我们在这里的选择是sigmoid函数，也成为“逻辑函数”

sigmoid函数图像如下：

可以看到，在Z=0,也即预估值
=0的时候，假说函数等于0.5,因此，可以用假说函数大等于于0.5说明当前预测值是正向类别的，反之则是反向类别的。

假说函数事实上提供的是一种概率，即类别是正向类别的概率。

决策边界

区分两个类别的边界称为决策边界，其中在如果取
=0作为决策边界，那么由满足
=0的所有x所构成的线即使决策边界，当然，也可以根据需求采取其他的决策边界，比如取满足
=1.0的x值构成的边界作为决策边界，那么此时的分类就会比较严格，在做一些需要安全性较高的预测可以采用这种决策边界。

开销函数

在分类问题中，由于具有不同的类别并且会带来大量的局部最优点，因此不能像回归问题那样简单的计算方差。

取而代之的，我们采用如下的开销函数形式：

假说函数值越原离目标值，开销越大。

这个开销函数的图像是一个convex的图像，也就是说总能收敛到全局最优点。

简化的开销函数

我们将分类讨论的开销函数整合成一个函数
，可得

向量化：

梯度下降

向量化：

可以发现与回归问题的公式是一样的，但其实是不一样的，因为这里采用的是logistic函数

多类别分类问题：一对多

当问题存在多个类别时，我们依然可以利用我们上面所用的方法，技巧是将多个类别看作是多个二元分类的问题，对每一个类别都计算它们自身的假说函数值（其实二元分类也是具有两个假说函数，只是由于和为1,因此另一个是冗余的），然后取其中具有最大的假说函数值的作为当前输入的类别。

https://share.coursera.org/wiki/index.php/ML:Logistic_Regression

参考：https://share.coursera.org/wiki/index.php/ML:Logistic_Regression

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[Machine Learning]4.逻辑回归（logistic regression）

接下来我们将从回归问题切换至分类问题。分类问题的名字logistic regression是由于历史原因，但事实上讨论的并不是用于regression问题，而是classification问题。分类在这时，我们的输出值y再也不是连续量，而是离散值，不是0就是1.y=0代表反向类别，y=1代表正向类别，当然我们也可以根据自身需要给y自己的类别定义。现在我们只讨论只有两个类别的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。