逻辑斯蒂回归与最大熵模型
逻辑斯蒂回归与最大熵模型
逻辑斯蒂回归是统计学中常用的经典分类方法;
最大熵是概率模型学习的一个准则,扩展到分类问题得到最大熵模型。
都属于对数线性模型
逻辑斯蒂回归模型
逻辑斯蒂分布
设 X X X为连续随机变量, X X X服从逻辑斯蒂分布是指 X X X具有如下的分布函数和密度函数:
F ( x ) = P ( X ≤ x ) = 1 1 + e − ( x − μ ) / γ F\left( x \right) = P\left( {X \le x} \right) = \frac{1}{
{1 + {e^{ - \left( {x - \mu } \right)/\gamma }}}} F(x)=P(X≤x)=1+e−(x−μ)/γ1
f ( x ) = F ′ ( x ) = e − ( x − μ ) / γ γ ( 1 + e − ( x − μ ) / γ ) 2 f\left( x \right) = F'\left( x \right) = \frac{
{
{e^{ - \left( {x - \mu } \right)/\gamma }}}}{
{\gamma {
{\left( {1 + {e^{ - \left( {x - \mu } \right)/\gamma }}} \right)}^2}}} f(x)=F′(x)=γ(1+e−(x−μ)/γ)2e−(x−μ)/γ
其中 μ \mu μ为位置参数, γ > 0 \gamma>0 γ>0为形状参数。
其图像如下所示:
可以发现图形为 S S S形曲线,以点 ( μ , 1 2 ) \left( {\mu ,\frac{1}{2}} \right) (μ,21)中心对称, γ \gamma γ越小,曲线在中心附近增长越快。
二项逻辑斯蒂回归模型
- 逻辑斯蒂回归模型
二项式逻辑斯蒂回归模型的条件概率如下:
P ( Y = 1 ∣ x ) = exp ( w ⋅ x + b ) 1 + exp ( w ⋅ x + b ) P\left( {Y = 1\left| x \right.} \right) = \frac{ {\exp \left( {w \cdot x + b} \right)}}{ {1 + \exp \left( {w \cdot x + b} \right)}} P(Y=1∣x)=1+exp(w⋅x+b)exp(w⋅x+b)
P ( Y = 0 ∣ x ) = 1 1 + exp ( w ⋅ x + b ) P\left( {Y = 0\left| x \right.} \right) = \frac{1}{ {1 + \exp \left( {w \cdot x + b} \right)}} P(Y=0∣x)=1+exp(w⋅x+b)1
这里 x x x为输入, Y ∈ { 0 , 1 } Y\in \left\{0,1\right\} Y∈{ 0,1}为输出, w w w和 b b b为参数, w ⋅ x w\cdot x w⋅x为内积。 - 特点
- 输出 Y = 1 Y=1 Y=1的对数几率是输入 x x x的线性函数
设事件发生的概率为 p p p,则发生几率为 p 1 − p \frac{p}{1-p} 1−pp,对数几率为:
l o g i t ( p ) = log p 1 − p = log P ( Y = 1 ∣ x
- 输出 Y = 1 Y=1 Y=1的对数几率是输入 x x x的线性函数