逻辑回归LogisticRegression

最新推荐文章于 2023-06-15 11:16:02 发布

青稣儿

最新推荐文章于 2023-06-15 11:16:02 发布

阅读量224

点赞数

分类专栏：算法文章标签：机器学习

本文链接：https://blog.csdn.net/qq_26857907/article/details/108093235

版权

算法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章目录

1 什么是逻辑回归？
2 逻辑回归的损失函数
3 逻辑回归的模型

1 什么是逻辑回归？

逻辑回归一般指logistic回归，是一种广义的线性回归（generalized linear model），常用于数据挖掘，疾病自动诊断，经济预测等领域。虽然名字里带“回归”，但是它实际上是一种分类方法，不仅能进行分类，还能获取每个类别的概率预测值。常用于两分类问题。
logistic回归通过函数L将w‘x+b对应一个隐状态p，p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic函数，就是logistic回归，如果L是多项式函数就是多项式回归。

2 逻辑回归的损失函数

2.1逻辑回归为何使用Sigmoid函数

Sigmoid函数形式如下：
Sigmoid函数图像
对于函数 $g(z)=\frac{1}{(1+e^{-z})}$ ，当z≥0 时,y≥0.5,分类为1，当 z<0时,y<0.5,分类为0。
使用Sigmoid函数原因有两个方面：
1）Sigmoid 函数自身的性质
a. sigmoid 函数连续，单调递增
b. sigmiod 函数关于（0，0.5）中心对称
c. 对sigmoid函数求导后计算速度快
$p = e x 1 + e x p = e x 1 + e x$
$p' = p * (1 - p) p' = p * (1 - p)$
2）指数族
logistic回归的损失函数为非指数族，逻辑回归认为函数其概率服从伯努利分布，将其写成指数族分布的形式。

2.2逻辑回归的步骤

（1）构造预测函数h
（2）构造损失函数J
（3）令J最小并求得回归参数w

2.3 预测函数的确定

逻辑回归主要用于二分类问题（即输出只有两种，分别代表两个类别），所以利用了Logistic函数（或称为Sigmoid函数），函数形式为：
$g(z)=\frac{1}{(1+e^{-z})}$

逻辑回归从其原理上来说，其实是实现了一个决策边界：
$\theta_0+\theta_1x_1+,...,+\theta_nx_n= \sum_{i=0}^n\theta_ix_i=\theta^Tx$
构造预测函数：（将回归方程写入其中）
$h_\theta(x)=g(\theta^Tx )=\frac{1}{(1+e^{-\theta^Tx })}$
$p=p(y=1|x,\theta)=h_\theta(x,\theta)=\frac{1}{1+e^{-\theta^Tx}}$

函数 $h_\theta(x,\theta)$ 的值，表示结果取1的概率，所以对于因变量x,分类结果为1和0的概率分别为：
$p(y=1|x,\theta)=h_\theta(x,\theta)$ $p(y=0|x,\theta)=1-h_\theta(x,\theta)$

2.4损失函数的构造

上边两式可改写为：
$p(y|x,\theta)=h_\theta(x,\theta)^y(1-h_\theta(x,\theta))^{1-y}$ 上式是在参数 $\theta$ 下，元组类标号为y的后验概率。假设现在已经得到了一个抽样样本，那么联合概率 $\prod_{i=1}^np(y_i|X_i;\theta)$ 的大小就可以反映模型的代价。联合概率的值越大，代价函数越小。

联合概率公式中采用连乘的方法不好计算，可用极大似然估计的方法进行求解，得到最大的参数 $\theta$ ，这个最大的参数将是最佳参数，使得联合概率的值最大，代价值最小。因此就得到了逻辑回归的损失函数：
$L(\theta)=\prod_{i=1}^nP(y_i|x_i;\theta)=\prod_{i=1}^n(h_\theta(x_i,\theta))^{y_i}(1-h_\theta(x_i,\theta))^{1-y_i}$ 损失函数的对数似然函数为：
$l(\theta)=logL(\theta)=\sum_{i=1}^n(y_ilogh_\theta(x_i,\theta))+((1-y_i)log(1-h_\theta(x_i,\theta)))$ 得到的这个函数越大,证明我们得到的W就越好.因为在函数最优化的时候习惯让一个函数越小越好,所以我们在前边加一个负号.得到逻辑回归的损失函数公式如下:
$J(\theta)=-l(\theta)=-\sum_{i=1}^n(y_ilogh_\theta(x_i,\theta))-((1-y_i)log(1-h_\theta(x_i,\theta)))$

3 逻辑回归的模型

对于模型的训练而言：实质上来说就是利用数据求解出对应的模型的特定的 $\theta$ 。从而得到一个针对于当前数据的特征逻辑回归模型。

3.1模型求解与推导

模型回归得到的是一个最优化模型，求解方法有梯度下降法、牛顿法等，这里求解逻辑回归的损失函数，采用最基本的方法——梯度下降法。

求解步骤如下:

1-随机一组 $\theta$ .
2-将 $\theta$ 带入交叉熵损失函数,让得到的点沿着负梯度的方向移动.
3-循环第二步.

推导过程

对损失函数求偏导,过程如下:

3.2最终模型

待补充

青稣儿

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归LogisticRegression

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar
复制链接

扫一扫

专栏目录