理解最大熵模型

最大熵模型与逻辑斯蒂回归模型一样,属于对数线性模型,因为推导出的最大熵模型公式满足输入与输出的对数函数成线性关系,如下:Pw(Y|X)=1Zw(x)exp(∑ni=1wifi(x,y))P_w(Y|X)=\frac{1}{Z_w(x)}exp(\sum_{i=1}^nw_if_i(x,y))其中,Zw(x)=∑yexp(∑ni=1wifi(x,y))Z_w(x)=\sum_yexp(\sum_{i=
摘要由CSDN通过智能技术生成

最大熵模型与逻辑斯蒂回归模型一样,属于对数线性模型,因为推导出的最大熵模型公式满足输入与输出的对数函数成线性关系,如下:

Pw(Y|X)=1Zw(x)exp(ni=1wifi(x,y))

其中,

Zw(x)=yexp(ni=1wifi(x,y))

1、最大熵原理
将最大熵原理使用到具体的应用模型中,就得到了最大熵模型。所以,要了解最大熵模型,首先需要知道最大熵原理。

最大熵原理要求在概率分布中,将使得熵最大的概率分布作为最好的选择。所谓熵,可以理解为系统的不确定程度。熵越大,系统的不确定程度就越高。比如在掷骰子游戏中,在条件未知的情况下,因为无法知道具体是哪一面,其不确定程度程度最高,即熵最大;当加入可能是两点或四点条件后,其不确定性就降低了,因为只有两个选择可以选,这时的熵也就变小了。

下面给出熵的定义:
假设离散随机变量X的概率分布是P(X),则定义熵H(P)为:

H(P)=- xP(x)logP(x)

由熵的定义可知:

0 H(P)log|X|

式中|X|表示变量X的取值个数。不等式左侧显然成立,右侧证明如下:
H(P)log|X|=xP(x)log1P(x)xP(x)log|X|
=xP(x)log1|X|P(x)
由不等式log x≤x-1,上式可变为:
xP(x)(1|X|P(x)1)
=x(1|X|P(x))
=x1|X

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值