逻辑回归算法梳理

最新推荐文章于 2020-11-22 12:04:57 发布

qingxuanmingye

最新推荐文章于 2020-11-22 12:04:57 发布

阅读量2.3k

点赞数 3

分类专栏：机器学习算法梳理文章标签：逻辑回归

本文链接：https://blog.csdn.net/qingxuanmingye/article/details/88958078

版权

本文深入探讨了逻辑回归与线性回归的差异，解释了逻辑回归的原理，包括sigmoid函数的应用和损失函数的推导。讨论了正则化、模型评估指标，如精准度和召回率，并提出了解决样本不均衡问题的方法。同时，介绍了sklearn中LogisticRegression参数的设置及其影响，如惩罚项、优化算法和多分类策略。

摘要由CSDN通过智能技术生成

逻辑回归算法梳理

1.逻辑回归与线性回归的联系与区别

逻辑回归(Logistic Regression)与线性回归(Linear Regression)都属于广义线性回归模型。

在分类问题中，预测属于某类的概率，可以看成回归问题。直接使用线性回归的输出作为概率是有问题的，因为其值有可能小于0或者大于1,这是不符合实际情况的，逻辑回归的输出正是[0,1]区间。线性回归只能预测连续的值，分类算法是输出0和1。逻辑曲线在z=0时，十分敏感，在z>>0或z<<0处，都不敏感，将预测值限定为[0,1]。需要注意的是：逻辑回归算法本质是分类算法。

线性回归中使用的是最小化平方误差损失函数，对偏离真实值越远的数据惩罚越严重；逻辑回归使用极大似然函数进行参数估计，使用交叉熵作为损失函数，对预测错误的惩罚是随着输出的增大，逐渐逼近一个常数。

（扩展：LR在线性回归的实数范围输出值上施加sigmoid函数将值收敛到0~1范围, 其目标函数也因此从差平方和函数变为对数损失函数, 以提供最优化所需导数（sigmoid函数是softmax函数的二元特例, 其导数均为函数值的f*(1-f)形式）。请注意, LR往往是解决二元0/1分类问题的, 只是它和线性回归耦合太紧, 不自觉也冠了个回归的名字. 若要求多元分类,就是要用到softmax了。）