统计学习方法——逻辑斯蒂回归与最大熵模型(一)

本文介绍了逻辑斯蒂回归和最大熵模型。逻辑斯蒂回归是一种经典的分类方法,包括二项逻辑斯蒂回归和多项逻辑斯蒂回归,常用于概率预测。最大熵模型基于最大熵原理,用于在满足约束条件下选择熵最大的模型,可用于分类任务。文章详细讨论了模型参数估计、最大似然估计等概念。
摘要由CSDN通过智能技术生成

逻辑斯蒂回归与最大熵模型

逻辑斯蒂回归是统计学中常用的经典分类方法;
最大熵是概率模型学习的一个准则,扩展到分类问题得到最大熵模型。
都属于对数线性模型

逻辑斯蒂回归模型

逻辑斯蒂分布

X X X为连续随机变量, X X X服从逻辑斯蒂分布是指 X X X具有如下的分布函数和密度函数:
F ( x ) = P ( X ≤ x ) = 1 1 + e − ( x − μ ) / γ F\left( x \right) = P\left( {X \le x} \right) = \frac{1}{ {1 + {e^{ - \left( {x - \mu } \right)/\gamma }}}} F(x)=P(Xx)=1+e(xμ)/γ1
f ( x ) = F ′ ( x ) = e − ( x − μ ) / γ γ ( 1 + e − ( x − μ ) / γ ) 2 f\left( x \right) = F'\left( x \right) = \frac{ { {e^{ - \left( {x - \mu } \right)/\gamma }}}}{ {\gamma { {\left( {1 + {e^{ - \left( {x - \mu } \right)/\gamma }}} \right)}^2}}} f(x)=F(x)=γ(1+e(xμ)/γ)2e(xμ)/γ
其中 μ \mu μ为位置参数, γ > 0 \gamma>0 γ>0为形状参数。

其图像如下所示:
图像
可以发现图形为 S S S形曲线,以点 ( μ , 1 2 ) \left( {\mu ,\frac{1}{2}} \right) (μ,21)中心对称, γ \gamma γ越小,曲线在中心附近增长越快。

二项逻辑斯蒂回归模型
  • 逻辑斯蒂回归模型
    二项式逻辑斯蒂回归模型的条件概率如下:
    P ( Y = 1 ∣ x ) = exp ⁡ ( w ⋅ x + b ) 1 + exp ⁡ ( w ⋅ x + b ) P\left( {Y = 1\left| x \right.} \right) = \frac{ {\exp \left( {w \cdot x + b} \right)}}{ {1 + \exp \left( {w \cdot x + b} \right)}} P(Y=1x)=1+exp(wx+b)exp(wx+b)
    P ( Y = 0 ∣ x ) = 1 1 + exp ⁡ ( w ⋅ x + b ) P\left( {Y = 0\left| x \right.} \right) = \frac{1}{ {1 + \exp \left( {w \cdot x + b} \right)}} P(Y=0x)=1+exp(wx+b)1
    这里 x x x为输入, Y ∈ { 0 , 1 } Y\in \left\{0,1\right\} Y{ 0,1}为输出, w w w b b b为参数, w ⋅ x w\cdot x wx为内积。
  • 特点
    • 输出 Y = 1 Y=1 Y=1的对数几率是输入 x x x的线性函数
      设事件发生的概率为 p p p,则发生几率为 p 1 − p \frac{p}{1-p} 1pp,对数几率为:
      l o g i t ( p ) = log ⁡ p 1 − p = log ⁡ P ( Y = 1 ∣ x
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值