回归算法———逻辑回归

chy3232

于 2022-10-17 10:31:19 发布

阅读量2.1k

点赞数 1

文章标签：人工智能线性回归逻辑回归回归

本文链接：https://blog.csdn.net/chy3232/article/details/127357508

版权

本文深入探讨了逻辑回归模型，作为线性回归的扩展，用于处理分类问题。通过介绍线性回归的局限性和逻辑回归的优势，展示了如何通过极大似然估计构建逻辑回归模型。逻辑回归通过sigmoid函数限制预测值在[0,1]之间，提高了模型的鲁棒性。此外，还讨论了逻辑回归的梯度下降法求解过程以及其在实际应用中的优点和不足，如预测准确性、模型解释性、概率输出和对多重共线性的敏感性。

摘要由CSDN通过智能技术生成

回归是一种极易理解的模型，就相当于y=f(x)，表明自变量x与因变量y的关系。最常见问题有如医生治病时的望、闻、问、切，之后判定病人是否生病或生了什么病，其中的望闻问切就是获取自变量x，即特征数据，判断是否生病就相当于获取因变量y，即预测分类。

逻辑回归模型

最简单的回归是线性回归，在此借用Andrew NG的讲义，有如图1.a所示，X为数据点——肿瘤的大小，Y为观测值——是否是恶性肿瘤。通过构建线性回归模型，如hθ(x)所示，构建线性回归模型后，即可以根据肿瘤大小，预测是否为恶性肿瘤hθ(x)≥.05为恶性，hθ(x)<0.5为良性。

线性回归示例图

然而线性回归的鲁棒性很差，例如在图1.b的数据集上建立回归，因最右边噪点的存在，使回归模型在训练集上表现都很差。这主要是由于线性回归在整个实数域内敏感度一致，而分类范围，需要在[0,1]。逻辑回归就是一种减小预测范围，将预测值限定为[0,1]间的一种回归模型，其回归方程与回归曲线如图2所示。逻辑曲线在z=0时，十分敏感，在z>>0或z<<0处，都不敏感，将预测值限定为(0,1)。

逻辑回归公式及示例图

逻辑回归其实仅为在线性回归的基础上，套用了一个逻辑函数。对于多元逻辑回归，可用如下公式似合分类:

对于训练数据集，特征数据x={x1, x2, … , xm}和对应的分类数据y={y1, y2, … , ym}。构建逻辑回归模型f(θ)，最典型的构建方法便是应用极大似然估计。首先，对于单个样本，其后验概率为：

那么，极大似然函数为：

log似然是：

逻辑回归实现

from sklearn.inear model import LogistiRegression
clf = LogisticRegression0
clfit(train. feature,label)
clf.predict(predict feature)

梯度下降

求逻辑回归模型f(θ)，等价于：

采用梯度下降法:

从而迭代θ至收敛即可：

逻辑回归模型的优缺点

逻辑回归优点

①逻辑回归的算法已经比较成熟，预测较为准确

②模型求出的系数易于理解，便于解释，尤其在银行业，80%的预测是使用逻辑回归

③结果是概率值

④训练快

逻辑回归缺点

当然它也有缺点，分类较多的y都不是很适用；对于自变量的多重共线性比较敏感，所以需要利用因子分析或聚类分析来选择代表性的自变量；另外预测结果呈现S型，两端概率变化小，中间概率变化大比较敏感，导致很多区间的变量的变化对目标概率的影响没有区分度，无法确定阙值。

chy3232

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
回归算法———逻辑回归

回归是一种极易理解的模型，就相当于y=f(x)，表明自变量x与因变量y的关系。最常见问题有如医生治病时的望、闻、问、切，之后判定病人是否生病或生了什么病，其中的望闻问切就是获取自变量x，即特征数据，判断是否生病就相当于获取因变量y，即预测分类。逻辑回归模型最简单的回归是线性回归，在此借用Andrew NG的讲义，有如图1.a所示，X为数据点——肿瘤的大小，Y为观测值——是否是恶性肿瘤。通过构建线性回归模型，如hθ(x)所示，构建线性回归模型后，即可以根据肿瘤大小，预测是否为恶性肿瘤hθ(x)≥.05
复制链接

扫一扫