2021-01-29

最新推荐文章于 2024-07-06 18:34:35 发布

The king always the king

最新推荐文章于 2024-07-06 18:34:35 发布

阅读量585

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43528542/article/details/113376882

版权

logistic回归与多重线性回归实际上有很多相同之处，最大的区别就在于它们的因变量不同，其他的基本都差不多。正是因为如此，这两种回归可以归于同一个家族，即广义线性模型（generalizedlinear model）。

这一家族中的模型形式基本上都差不多，不同的就是因变量不同。

如果是连续的，就是多重线性回归；
如果是二项分布，就是Logistic回归；
如果是Poisson分布，就是Poisson回归；
如果是负二项分布，就是负二项回归。

Logistic回归的因变量可以是二分类的，也可以是多分类的，但是二分类的更为常用，也更加容易解释。所以实际中最常用的就是二分类的Logistic回归。

Logistic回归的主要用途：

寻找危险因素：寻找某一疾病的危险因素等；
预测：根据模型，预测在不同的自变量情况下，发生某病或某种情况的概率有多大；
判别：实际上跟预测有些类似，也是根据模型，判断某人属于某病或属于某种情况的概率有多大，也就是看一下这个人有多大的可能性是属于某病。

通常被用来计算一个例子属于一个特殊分类的概率（比如说这份邮件是垃圾邮件的概率)

如果概率大于50%，算作1，属于这个分类，如果概率小于50%，算作0 ，不属于这个分类，这使得他成为了一个binary classifier.

他和线性回归的联系在于计算，他也会计算输入的features(+bias term) 的加了权重的和，但是它并不像线性回归那样直接给出结果，他给出这个结果的logistic.

logistic(logit)-- 被叫做sigmoid function（s-形状)，输出的数在0-1之间。

只要logistic regression model测出来了一个例子属于一个特殊分类的概率，他就可以很容易预测出来是否属于这个分类。

比如说概率小于0.5，y = 0不属于；概率大于0.5，y=1,属于。

损失函数先从单个的例子来想，

单个的例子来说的话:

当y=1 时，损失函数c = -log(p)

当y=0时，损失函数c = -log(1-p)

(p是概率)

当p接近0的时候，c = -log(p)将会非常大，也即这个函数将一个本该属于这个分类的例子看作不属于。

当p接近1的时候，c = -log(1-p)将会非常大，也就是它将一个本不该属于这个分类的例子看作属于（p=1)

对于整个训练集来说的话，损失函数log loss可以简单的看作是整个训练集的平均损失。

损失函数是convex，所以我们可以用梯度下降（gradient descent)来保证可以找到最小值（global minimum)

The king always the king

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。