逻辑回归（logistics regression）及其应用（MLIA第五章）

最新推荐文章于 2024-02-01 16:42:35 发布

小9

最新推荐文章于 2024-02-01 16:42:35 发布

阅读量604

点赞数 1

分类专栏： ----------大数据挖掘和机器学习---------- ++机器学习文章标签：机器学习数据挖掘逻辑回归 python

本文链接：https://blog.csdn.net/zhengwei223/article/details/79105478

版权

本文详细介绍了逻辑回归的基本原理，包括与线性回归的对比、Sigmoid函数的作用、参数优化的梯度下降法，以及逻辑回归在分类问题中的应用。文章通过实例探讨了如何计算回归系数，讨论了迭代次数对性能的影响，并提供了代码实现和数据可视化的过程。最后，文中提出了优化策略以减少迭代次数并加速系数收敛。

摘要由CSDN通过智能技术生成

一、基本原理

逻辑回归与线性回归

Logistic Regression和Linear Regression的原理是相似的，按照我自己的理解，可以简单的描述为这样的过程：

（1）找一个合适的预测函数（Andrew Ng的公开课中称为hypothesis），一般表示为h函数，该函数就是我们需要找的分类函数，它用来预测输入数据的判断结果。这个过程时非常关键的，需要对数据有一定的了解或分析，知道或者猜测预测函数的“大概”形式，比如是线性函数还是非线性函数。

（2）构造一个Cost函数（损失函数），该函数表示预测的输出（h）与训练数据类别（y）之间的偏差，可以是二者之间的差（h-y）或者是其他的形式。综合考虑所有训练数据的“损失”，将Cost求和或者求平均，记为J(θ)函数，表示所有训练数据预测值与实际类别的偏差的估计，称为风险函数或期望损失函数。

（3）显然，J(θ)函数的值越小表示预测函数越准确（即h函数越准确），所以这一步需要做的是找到J(θ)函数的最小值。找函数的最小值有不同的方法，Logistic Regression实现时有的是梯度下降法（Gradient Descent）。

分类问题与Sigmoid函数

$\sigma (z) = \frac{1}{1+e^{-z}}$

Sigmoid函数看起来很像一个阶跃函数。
海维赛德阶跃函数——heaviside step function

自变量为0，函数值为0.5
自变量趋于正无穷，函数值趋近于1
自变量趋于负无穷，函数值趋近于0

（为了实现Logistic回归分类器，我们可以在每个特征上都乘以一个回归系数，然后把所有的结果值相加，）将这个总和代入Sigmoid函数中，进而得到一个范围在0~1之间的数值。任何大于0.5的数据被分入1类，小于0.5即被归入0类。所以， Logistic回归也可以被看成是一种概率估计。

括号内的后面会讲。简单来说Sigmoid做分类器使用，逻辑回归计算出最佳拟合的回归系数。

线性回归的参数或系数

假设结果为若干属性（特征）值的线性组合 $z=w_0*x_0+w_1*x_1+...+w_n*x_n$
写为向量：
$z=w^Tx \tag{式1}$

其中的向量x是分类器的输入数据，向量w也就是我们要找到的最佳参数

预测函数

将上两小结内容整合起来，有逻辑回归的预测函数为：
$h_\theta (x) = \frac{1}{1+e^{-\theta^T(x)}}$ ,其中 $\theta$ 是上小节中w的估计值。

Cost函数

损失函数：表示预测的输出（h）与训练数据类别（y）之间的偏差，可以是二者之间的差（h-y）或者是其他的形式

损失函数最常见的形式就是 $(h^{(i)}-y^{(i)})$ ，
上标(i)表示第i个样本，而不是指数
风险函数常见形式为：

J (θ) = 1 m \sum i = 1 N (h θ (x (i)) - y (i)) 2

$J(\theta) = \frac{1}{m} \sum_{i=1}^{N}(h_\theta(x^{(i)})-y^{(i)})^2$
N是样本数，求θ使得J(θ)最小，这样的θ就是理想的参数，对线性回归来说θ就是理想的回归系数。

但是，对于逻辑回归（及任何二分类问题）来说， $h_\theta(x^{(i)})$ 的取值是0或者1，所以J(θ)不是一个凸函数，难以通过简单的手段求极小值。

所以我们必须找一个新的损失函数：

l o s s (h θ (x (i)), y (i)) = {- l o g (h θ (x (i))) w h e n : y (i) = 1 - l o g (1 - h θ (x (i))) w h e n : y (i) = 0

$loss(h_\theta(x^{(i)}),y^{(i)}) = \left\{\begin{matrix} -log(h_\theta(x^{(i)})) when :y^{(i)}=1\\ -log(1-h_\theta(x^{(i)})) when :y^{(i)}=0 \end{matrix}\right.$

什么意思呢？y的真实值为1，预测值也为1时，损失为0，但预测值为0时，损失为正无穷；可类推y=0的叙述。

统一成一个式子，在某个样本上的损失函数定义为：

loss(hθ(x(i)),y(i))=−[y(i)log(hθ(x(i)))+(1−y(i)))log(1−hθ

最低0.47元/天解锁文章

小9

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录