最大熵模型

足下之臣

于 2019-03-18 10:40:52 发布

阅读量409

点赞数

分类专栏：数据挖掘文章标签：数据挖掘最大熵模型自然语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43893567/article/details/88626670

版权

最大熵模型是一种统计方法，用于在满足已知约束条件下寻找最不确定的分布，广泛应用于词性标注、句法分析和机器翻译等领域。模型以熵最大化为目标，但当样本量大时，优化过程可能变得复杂。最大熵模型的优点在于高准确性和灵活的约束条件，缺点是计算量大，尤其是在大规模数据集上。

摘要由CSDN通过智能技术生成

1.最大熵模型：

联合分布，边缘分布，条件分布, 经验分布
为了避免混淆三种分布的定义，这里举一个最简单的例子。
设 x,y的联合分布如下(横轴是x的取值，纵轴y是的取值)
x/y
0.1 0.3 0.1 0.5
0.2 0.2 0.1 0.5
0.3 0.5 0.2 1
两者的边缘分布为
0.5 0.5 两个表格的分割线 0.3 0.5 0.2
条件分布为：在特定的条件下这个事情发生的概率
假设我有5个苹果，条件是在这五个苹果（x事件当中），红苹果（y事件）出现的概率：P(y|x)
经验分布：
经典统计推断主要的思想就是用样本来推断总体的状态，因为总体是未知的，我们只能通过多次试验的样本（即实际值）来推断总体。

经验分布函数是在这一思想下的一种方法，通过样本分布函数来估计总体的分布函数。

因此在最大熵模型中就运用经验分布。

熵：表示物质系统状态的一种度量。用它表征系统无序成都，熵越大，系统越无序，系统结构和运动越不确定和无规则，在信息论中同样使用，熵越大，这件事情发生的概率越小，事件越不确定。

熵的不同种类

最大熵原理：对一个随机事件的概率分布进行预测时&

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。