最大熵模型

Annie_Jun

于 2019-03-13 09:11:41 发布

阅读量789

点赞数

分类专栏：数学基础图像处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/moon_boat/article/details/82757956

版权

最大熵模型是一种在特征条件下保留最大不确定性的概率分布选择方法。它基于熵的概念，熵值越大表示随机变量的不确定性越高。当仅掌握部分关于未知分布的知识时，最大熵模型会选择熵最大的概率分布作为最优解。在学习过程中，模型通过满足特定特征函数的期望值与经验分布相等的约束条件来优化。最大熵模型通常用于解决如自然语言处理中的分类问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、熵：随机变量不确定性的度量，不确定性越大，熵值越大；若随机变量退化为定值，熵为0。均匀分布是最不确定的分布。

假设离散随机变量x的概率分布为p(x)，则其熵为：，其中0 $\leqslant$ H（p） $\leqslant$ log $\left | x \right |$ 。

其中|X|是X的取值个数.当且仅当X的分布是均匀分布时右边等号成立, 也就是说, 当X服从均匀分布时, 熵最大。

2、最大熵：保留最大的不确定性（让熵达到最大）

3、最大熵模型的原理：在特征条件限制下，提取最优的概率分布(在只掌握关于未知分布的部分知识时，应该选取符合这些知识但熵值最大的概率分布)

给定一个训练数据集：T={(

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。