Logistic Regression基本原理解析

weixin_40008288

于 2020-12-15 21:54:03 发布

阅读量326

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_40008288/article/details/111241508

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

逻辑回归

基本概念

Logistic Regression 逻辑斯谛回归，属于对数线性模型，亦属于分类模型的一种。模型假设数据服从Logistic分布，然后使用极大似然估计做参数的估计。

首先我们需要了解什么是Logistic分布：

设X是连续随机变量，X服从逻辑斯谛分布是指X具有下列分布函数和密度函数：
$\leq x) = \frac{1}{1+e^{-(x-\mu)/\gamma}}$
$\frac{e^{-(x-\mu)/\gamma}}{\gamma(1+e^{-(x-\mu)/\gamma})^2}$
公式中， $\mu$ 是位置参数， $\gamma$ 是形状参数。

密度函数和分布函数的走势如下：

其中，分布函数是以点$(\mu,\frac{1}{2})$为中心对称的S形曲线，满足：

$F(-x+\mu)-\frac{1}{2} = -F(x+\mu)+\frac{1}{2}$

什么是概率函数、什么是分布函数呢？

概率密度函数：区间内的面积除以总面积，即为该区间的概率密度。

对于一维实随机变量X，设它的累积分布函数是 $F_X(x)$ ，如果存在可测函数 $f_X(x)$ 满足: $F_X(x)=\int^{x}_{-\infty}{f_X(t)}dt$ ，那么X是一个连续型随机变量，并且是它的概率密度函数。

分布函数：
分布函数就是变量小于等于某个特定值a的概率（或者频率，如果是用数据统计出来的话），也即 $F(a)=P\{X<a\}$

逻辑回归模型

二项逻辑斯谛回归模型

定义：满足如下条件概率分布：
$1|x)=\frac{exp(w\cdot x+b)}{1+exp(w \cdot x+b)}$
$0|x)=\frac{1}{1+exp(w \cdot x+b)}$
其中，x为输入，Y为输出。w为权重参数，b为偏置。
exp，以自然常数e为底的指数函数

当实例 $x$ 输入模型后，会计算出 $Y = 1$ 和 $Y = 0$ 时候的概率值，模型将比较两个数值的大小，并将实例 $x$ 分到概率值较大的那一类。从输出上，也可以看出该模型是典型的0，1二分类模型。

从事件发生几率的角度上来说（该事件发生的概率与不发生的概率的比值）,输出 $Y = 1$ 的对数几率是由输入 $x$ 的线性函数来表示的模型：
$\frac{p}{1-p}=log \frac{P(Y=1|x)}{1-P(Y=1|x)}=w\cdot x$

多项逻辑斯谛回归模型

在二分类的基础上进行推广可以得到多分类模型。这里需要将输出的Y进行推广，从0，1推广至K。

定义：满足如下条件概率分布：
$k|x)=\frac{exp(w_k\cdot x)}{1+\sum^{K-1}_{k=1}exp(w_k \cdot x)},k=1,2,...,K-1$
$0|x)=\frac{1}{1+\sum^{K-1}_{k=1}exp(w_k \cdot x)}$
其中，x为输入，Y为输出。w为权重参数,K为总的输出类个数。
exp，以自然常数e为底的指数函数