最大熵模型

最新推荐文章于 2020-02-13 13:52:04 发布

Hearthougan

最新推荐文章于 2020-02-13 13:52:04 发布

阅读量1k

点赞数 2

分类专栏： Machine Learning NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hearthougan/article/details/81488588

版权

最大熵模型是一种概率模型学习准则，它在满足所有约束条件的模型中选择熵最大的模型。通过让模型符合已知条件，避免对未知情况做出主观假设，从而达到保留全部不确定性的效果，降低预测风险。

摘要由CSDN通过智能技术生成

本篇博客只是最近两天看最大熵模型的一个理解和简单总结，只为了阐述清楚最大熵模型，不涉及公式推导。为了怕很快忘记，特意综述一下，如有不正确之处欢迎指正。

最大熵原理

熵：某种意义上说，概率是度量随机事件的确定性，熵是度量随机事件的不确定性。对于随机变量的概率分布来说，随机变量的分布越均匀，其熵越大。

最大熵原理：我们构建一个概率模型对某个随机变量的分布进行预测时，发现有很多概率模型满足给定约束条件，他们都可以准确表述随机变量的分布，那么哪个模型是最好的模型呢？在满足所有约束条件的概率模型集合中，选取熵最大的模型作为最好的模型，这就是最大熵原理。它是概率模型学习的一个准则。

举个例子（来自博士论文：A maximum entropy approach to natural language processing）：

经过大量的统计，在英文翻译成法文时候，英语单词in，会被翻译成法语单词 { dans, en, à, au cours de, pendant } 5个中的一个，我们假设我们的翻译模型为P，选择某个法语单词x作为英语单词in的法语翻译的概率，记为：P(x)。那么该模型首要的约束条件就是：

$p(dans)+p(en)+ p(\grave{a})+p(au cours de)+p(pendant) = 1$

这是我们对翻译过程的一个统计信息，这是一个约束条件，我们假设只有这个约束条件，那么满足该约束条件的模型有很多。比如某个模型满足：

$p(dans) = 1$

$p(en) = p(\grave{a}) = p(au cours de) = p(pendant) = 0$

那么该翻译模型会将英文单词in一直翻译成dans。再比如某个翻译模型满足：

$p(dans) = p(en) = 1/2$

$p(\grave{a}) = p(au cours de) = p(pendant) = 0，$

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。