最大熵的两个证明

maximum entropy approach to natural language processing这篇论文是最大熵的经典论文。但是这篇论文仍然没有把最大熵模型完全推导出来,有些地方还是直接给的结论,这里补充两个论文中没有给出证明的地方,1、p(y|x)的推导,2、最大熵全局唯一极值的证明。内容来自清华大学最大熵的ppt

 

第一个问题:

 

 

L拉格朗日法把有约束的最优化问题转化为无约束问题的式子,对应论文式子(7)

 

求L取得极值时的p(y|x)

 

 

当导数等于0时,有

 

 

对于给定x,任意的y,所有P(y|x)的和为1,即

 

 

于是得到论文中的结论:

 

 

第二个问题:最大熵模型,有全局唯一的极值,不必担心收敛于一个次优解

 

一阶导数:

 

二阶导数:

可见,一阶导数存在等于0的情况,二阶导数恒小于0,最大熵模型,有全局唯一的极值,不必担心收敛于一个次优解

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值