最大熵模型

最新推荐文章于 2022-09-14 19:58:26 发布

恋蛩音

最新推荐文章于 2022-09-14 19:58:26 发布

阅读量407

点赞数

分类专栏：计算机视觉面试神问

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_17846375/article/details/99698208

版权

计算机视觉面试神问专栏收录该内容

8 篇文章 1 订阅

订阅专栏

目录

信息论基础

情况一，独立事件的自信息

情况二，两个事件不独立的自信息

互信息的求法

信息（信源）熵

条件熵和联合熵的关系

熵的基本性质

最大熵模型

最大熵原理

最大熵模型的构建

信息论基础

自信息

定义：

p(x)表示概率，如果概率p(x)是确定性的度量，则自信息是对不确定性的度量

分两种情况，

情况一，独立事件的自信息

700

情况二，两个事件不独立的自信息

这里有个概念，就是非独立事件的概率求法是p(x|y) = p(xy)/p(y)

互信息的求法

熵

对平均变量的平均不确定性的度量

信息（信源）熵

通俗讲，信息熵也是熵，是对自信息量的一个期望值，遍历所有的先验概率空间的先验概率分布取值并乘上对应的自信息进行累加。

从上可以直到，H(X)表示的是一个期望，那么必定是大于等于0的，反过头看熵所定义的函数（表达一共概率分布函数到实值的映射）

看左边那个图，x(0,1)，对应y都是正的，x(1,2)，对应y都是负的。为什么为负呢？这不和刚才说的相悖了吗？其实是不矛盾的，因为熵函数的自变量x实际是上是p（x）,即概率分布函数，p（x）肯定是大于0小于1的，换句话说，真正的函数图像应该是在x（0，1）之间的，如右图所示。

信息熵表示信源的平均不确定度，平均自信息量表示消除不确定度所需要信息的量度，两者数值上相等，但是意义不同

条件熵

那么，进一步

联合熵

条件熵和联合熵的关系

熵的基本性质

1.非负性

2.对称性

同一个熵函数，中的所有变量可以互换

3.确定性

4.最大熵定理

5.条件熵小于无条件熵

最大熵模型

最终可以概况为概率模型，最后的取值为概率值，大于某个阈值判为正，小于某个阈值判为负。

最大熵原理

目标：

最大熵模型的构建

可行解是其中一种解，也可以有其他解。但当没有先验的时候，最稳妥的是平均投，这就是可行解的由来。熵越大，模型越好

f(x，y) 是一个指示函数。

当采样趋于无穷的时候，采样分布相等于原分布，那就是两个模型中的信息期望是相等的。

依据熵的定义来建模。

最大熵模型求解问题转换为了约束优化问题，一般用拉格朗日法来求解。

要求是凸的才可以转换为对偶问题来求解。

求解过程：

反过头来，再看，整个过程就是下面的样子。

另一个求解方法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
最大熵模型

熵的定义
复制链接

扫一扫

专栏目录

恋蛩音 CSDN认证博客专家 CSDN认证企业博客

码龄10年

302: 原创

5万+: 周排名

116万+: 总排名

24万+: 访问

: 等级

4423: 积分

80: 粉丝

127: 获赞

30: 评论

603: 收藏

私信

关注

热门文章

分类专栏

最新评论

Fast(er) rcnn的损失函数总结
y1443221758: 您这说的是RPN的损失吧，最终预测不是应该是多分类了么
C语言二维数组指针用法
moveddown: 一维线性中最后一行，包含是不是打错了，应该是包含3个元素
The Codeless Code: Case 2 Unknown Unknowns（未知的未知）
katrina95: 这个故事确实有些难懂，不过结合title “Unknown unknowns”（你不知道你不知道的那些知识），我的理解是：1）人们很难发现/意识到那些自己知道，但是别人不知道的东西。2）人们发现不了自己不知道的东西。所以当国王描述他的系统时，即使他已经提供了他认为足够的东西，但还是有一些他知道但是他不知道别人不知道的东西，或者是，他不知道他自己不知道的东西。这些都导致了最后的东西不是他想要的。死掉的使者正是因为他不知道饭菜有毒，而大师们都以为他知道，所以导致了悲剧。而使者自己也确实不知道自己不知道饭菜有毒。
i++（前缀式自增）与++i（后缀式自增）的区别与效率比对—C/C++程序基础（三）
我在cs读大学: int fun(int a,int b){ return a+b; } int main (void) { int x=2,y=3,z=4; printf("%d",fun(fun((x--,y++,x+y),z--),x)); return 0; } 比如这个里面z--就是把z先和另一个数相加再自减的，我懵逼了
i++（前缀式自增）与++i（后缀式自增）的区别与效率比对—C/C++程序基础（三）
我在cs读大学: 前自增和后自增好像就搞不清楚啊，比如 int i=1; i--; printf("%d",i); 这时候就是先自减在输出，把i--放到printf里面就是先输出再自减。如果一个函数fun(i){ return i;) main{ fun(i--); }这时候居然又是先return i再自减

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。