机器学习算法——逻辑回归(LR)

最新推荐文章于 2024-09-10 14:26:22 发布

土豆洋芋山药蛋

最新推荐文章于 2024-09-10 14:26:22 发布

阅读量2.5k

点赞数 1

分类专栏：机器学习与算法【ML】文章标签：机器学习算法 Logistic 逻辑回归

本文链接：https://blog.csdn.net/qq_33414271/article/details/78191489

版权

机器学习与算法【ML】专栏收录该内容

35 篇文章 8 订阅

订阅专栏

LR是很多分类算法的基础组件，它的好处是输出值自然地落在0到1之间，并且有概率意义。模型清晰，背后的概率学经得住推敲。它拟合出来的参数就代表了每一个特征(feature)对结果的影响。

Logistic回归分析:

优势比：

假设在m个独立自变量 $_{1},x_{2}\cdots ,x _{m}$ 的作用下，记取1的概率是 $p = P (y = 1 ∣ X)$ ，取0概率是 $1 - p$ ，则概率之比为 $\frac{p}{1-p}$ ，称为事件的优势比（odds），又称为OR。

Logistic函数：

对odds取自然对数即得Logistic变换 $Logit(p)=ln\frac{p}{1-p}$ （又称为对数几率，log odds）令 $Logit(p)=ln\frac{p}{1-p}=z$ ，则 $p=\frac{1}{1+e^{-z}}$ 即为Logistic函数，也称为sigmoid函数，如图：
这里写图片描述

当p在（0,1）变化时，odds的取值范围是（0，+∞），则 $ln\frac{p}{1-p}$ 的取值范围为（-∞，+∞）

Logistic回归模型：

Logistic回归模型是建立在 $ln\frac{p}{1-p}$ 与自变量的线性回归模型。
Logistic回归模型为：
这里写图片描述
因为 $ln\frac{p}{1-p}$ 的取值范围为（-∞，+∞），所以 $_{1},x_{2}\cdots ,x _{m}$ 可以在任意范围内取值。
记得到：

这里写图片描述

Logistic回归模型的解释：

$\beta _{0}$ :在没有自变量，即 $_{1},x_{2}\cdots ,x _{m}$ 全部取0， $y = 1$ 与 $y = 0$ 发生概率之比的自然对数；
$\beta _{i}$ :某自变量 $x _{i}$ 变化时，即 $y _{i}=1$ 与 $y _{i}=1$ 相比，y=1优势比的对数值。
函数映射
线性函数的值越接近于正无穷大，概率值就越接近1；反之，其值越接近于负无穷，概率值就越接近0。这样的模型就是LR模型。

LR本质上还是线性回归，知识特征到结果的映射过程中加了一层函数映射（即sigmoid函数），即先把特征线性求和，然后使用sigmoid函数将线性和约束至（0，1）之间，结果值用于二分或回归预测。

2. Logistic回归建模步骤

对已有数据进行特征筛选（逻辑回归本质上还是一种线性回归模型，筛选出来的变量说明与结果具有较强的线性相关性，被筛选掉的特征只能说明与结果之间没有线性关系）。
用ln⁡(p/(1-p))与自变量列出回归方程，估计出模型的回归系数。
进行模型检验，最基本的检验方法是正确率，其次还有混淆矩阵，ROC曲线，KS值等。

特征筛选：
特征选取是机器学习领域非常重要的一个方向。

主要有两个功能：
（1）减少特征数量、降维，使模型泛化能力更强，减少过拟合
（2）增强特征和特征值之间的理解
主要方法：
（1）基本的方法方差检验（F值越大和P值越小）。
（2）递归特征消除（RFE）
（3）稳定性选择法（Stability Selection）

性能度量：
机器学习模型性能度量

LR与SVM

两种方法都是常见的分类算法，从目标函数来看，区别在于逻辑回归采用的是logistical loss，svm采用的是hinge loss。这两个损失函数的目的都是增加对分类影响较大的数据点的权重，减少与分类关系较小的数据点的权重。SVM的处理方法是只考虑support vectors，也就是和分类最相关的少数点，去学习分类器。而逻辑回归通过非线性映射，大大减小了离分类平面较远的点的权重，相对提升了与分类最相关的数据点的权重。两者的根本目的都是一样的。此外，根据需要，两个方法都可以增加不同的正则化项，如l1,l2等等。所以在很多实验中，两种算法的结果是很接近的。但是逻辑回归相对来说模型更简单，好理解，实现起来，特别是大规模线性分类时比较方便。而SVM的理解和优化相对来说复杂一些。但是SVM的理论基础更加牢固，有一套结构化风险最小化的理论基础，虽然一般使用的人不太会去关注。还有很重要的一点，SVM转化为对偶问题后，分类只需要计算与少数几个支持向量的距离，这个在进行复杂核函数计算时优势很明显，能够大大简化模型和计算量。

两者对异常的敏感度也不一样。同样的线性分类情况下，如果异常点较多的话，无法剔除，首先LR，LR中每个样本都是有贡献的，最大似然后会自动压制异常的贡献，SVM+软间隔对异常还是比较敏感，因为其训练只需要支持向量，有效样本本来就不高，一旦被干扰，预测结果难以预料。

感谢（参考文献）
书籍：python数据分析与挖掘实战
Free Will 博客

土豆洋芋山药蛋

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法——逻辑回归(LR)

LR是很多分类算法的基础组件，它的好处是输出值自然地落在0到1之间，并且有概率意义。模型清晰，背后的概率学经得住推敲。它拟合出来的参数就代表了每一个特征(feature)对结果的影响。Logistic回归分析:优势比：假设在m个独立自变量x1,x2,⋯,xm的作用下，记取1的概率是p=P(y=1|X)，取0概率是1-p，则概率之比为p/(1-p)，称为事件的优势比（odds），又称为OR。Logi
复制链接

扫一扫

专栏目录