逻辑回归
基本概念
Logistic Regression 逻辑斯谛回归,属于对数线性模型,亦属于分类模型的一种。模型假设数据服从Logistic分布,然后使用极大似然估计做参数的估计。
首先我们需要了解什么是Logistic分布:
设X是连续随机变量,X服从逻辑斯谛分布是指X具有下列分布函数和密度函数:
F ( x ) = P ( X ≤ x ) = 1 1 + e − ( x − μ ) / γ F(x) = P(X \leq x) = \frac{1}{1+e^{-(x-\mu)/\gamma}} F(x)=P(X≤x)=1+e−(x−μ)/γ1
f ( x ) = F ′ ( x ) = e − ( x − μ ) / γ γ ( 1 + e − ( x − μ ) / γ ) 2 f(x) = F'(x) = \frac{e^{-(x-\mu)/\gamma}}{\gamma(1+e^{-(x-\mu)/\gamma})^2} f(x)=F′(x)=γ(1+e−(x−μ)/γ)2e−(x−μ)/γ
公式中, μ \mu μ是位置参数, γ \gamma γ是形状参数。
密度函数和分布函数的走势如下:
其中,分布函数是以点$(\mu,\frac{1}{2})$为中心对称的S形曲线,满足:F ( − x + μ ) − 1 2 = − F ( x + μ ) + 1 2 F(-x+\mu)-\frac{1}{2} = -F(x+\mu)+\frac{1}{2} F(−x+μ)−21=−F(x+μ)+21
什么是概率函数、什么是分布函数呢?
- 概率密度函数:区间内的面积除以总面积,即为该区间的概率密度。
对于一维实随机变量X,设它的累积分布函数是 F X ( x ) F_X(x) FX(x),如果存在可测函数 f X ( x ) f_X(x) fX(x)满足: F X ( x ) = ∫ − ∞ x f X ( t ) d t F_X(x)=\int^{x}_{-\infty}{f_X(t)}dt FX(x)=∫−∞xfX(t)dt,那么X是一个连续型随机变量,并且是它的概率密度函数。
- 分布函数:
分布函数就是变量小于等于某个特定值a的概率(或者频率,如果是用数据统计出来的话),也即 F ( a ) = P { X < a } F(a)=P\{X<a\} F(a)=P{X<a}
逻辑回归模型
二项逻辑斯谛回归模型
定义:满足如下条件概率分布:
P ( Y = 1 ∣ x ) = e x p ( w ⋅ x + b ) 1 + e x p ( w ⋅ x + b ) P(Y= 1|x)=\frac{exp(w\cdot x+b)}{1+exp(w \cdot x+b)} P(Y=1∣x)=1+exp(w⋅x+b)exp(w⋅x+b)
P ( Y = 0 ∣ x ) = 1 1 + e x p ( w ⋅ x + b ) P(Y= 0|x)=\frac{1}{1+exp(w \cdot x+b)} P(Y=0∣x)=1+exp(w⋅x+b)1
其中,x为输入,Y为输出。w为权重参数,b为偏置。
exp,以自然常数e为底的指数函数
当实例 x x x输入模型后,会计算出 Y = 1 Y=1 Y=1和 Y = 0 Y=0 Y=0时候的概率值,模型将比较两个数值的大小,并将实例 x x x分到概率值较大的那一类。从输出上,也可以看出该模型是典型的0,1二分类模型。
从事件发生几率的角度上来说(该事件发生的概率与不发生的概率的比值),输出
Y
=
1
Y=1
Y=1的对数几率是由输入
x
x
x的线性函数来表示的模型:
l
o
g
i
t
(
p
)
=
l
o
g
p
1
−
p
=
l
o
g
P
(
Y
=
1
∣
x
)
1
−
P
(
Y
=
1
∣
x
)
=
w
⋅
x
logit(p) = log \frac{p}{1-p}=log \frac{P(Y=1|x)}{1-P(Y=1|x)}=w\cdot x
logit(p)=log1−pp=log1−P(Y=1∣x)P(Y=1∣x)=w⋅x
多项逻辑斯谛回归模型
在二分类的基础上进行推广可以得到多分类模型。这里需要将输出的Y进行推广,从0,1推广至K。
定义:满足如下条件概率分布:
P ( Y = k ∣ x ) = e x p ( w k ⋅ x ) 1 + ∑ k = 1 K − 1 e x p ( w k ⋅ x ) , k = 1 , 2 , . . . , K − 1 P(Y= k|x)=\frac{exp(w_k\cdot x)}{1+\sum^{K-1}_{k=1}exp(w_k \cdot x)},k=1,2,...,K-1 P(Y=k∣x)=1+∑k=1K−1exp(wk⋅x)exp(wk⋅x),k=1,2,...,K−1
P ( Y = 0 ∣ x ) = 1 1 + ∑ k = 1 K − 1 e x p ( w k ⋅ x ) P(Y= 0|x)=\frac{1}{1+\sum^{K-1}_{k=1}exp(w_k \cdot x)} P(Y=0∣x)=1+∑k=1K−1exp(wk⋅x)1
其中,x为输入,Y为输出。w为权重参数,K为总的输出类个数。
exp,以自然常数e为底的指数函数