最大熵

最新推荐文章于 2019-01-28 12:54:14 发布

muye5

最新推荐文章于 2019-01-28 12:54:14 发布

阅读量898

点赞数

分类专栏：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/myue5/article/details/9180307

版权

数据挖掘专栏收录该内容

14 篇文章 0 订阅

订阅专栏

零星感悟：最大熵

知之为知之，不知为不知

论文：The Improved Iterative Scaling Algorithm: A Gentle Introduction

核心思想：构造经验期望减去模型期望的差，然后让这个差等于零，此时的权重参数即为最优解的参数

下面是看李航的<<统计学习方法>>最大熵一章和论文推导时的一个疑惑，幸得别人指点明白了。

在最大熵模型中，条件概率分布式这样的：

其中

用Improved Iterative Scaling 算法求解最优的参数时，定义条件概率的对数似然函数为：

将上面的公式带入得：

以上都是论文The Improved Iterative Scaling Algorithm: A Gentle Introduction中的推导过程，

但是我不理解的地方是公式

是怎么得来的，其中的是怎么得到的，

我的推导中应该是的，如果说前者可以等于后者，

那为什么公式还保留了前面的，这是数学上的技巧么？

这个疑惑一直困扰了我一上午，直到别人告诉我说，

公式后一项中的之所以能够合并为，而前一项没有合并的原因在于：

首先，和是相等的

更重要的是仅仅是x的函数，而不是y的函数，

因为它对所有的y已经进行了求和，所以前面的才能够合并成

而中的是y的函数，

所以不能将其合并成

说到这里，豁然开朗，数学差真是硬伤啊~~~~~

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
最大熵

零星感悟：最大熵知之为知之，不知为不知论文：The Improved Iterative Scaling Algorithm: A Gentle Introduction核心思想：构造经验期望减去模型期望的差，然后让这个差等于零，此时的权重参数即为最优解的参数下面是看李航的>最大熵一章和论文推导时的一个疑惑，幸得别人指点明白了。在最大熵模型中，条件概率分布式这样的：
复制链接

扫一扫

专栏目录

muye5 CSDN认证博客专家 CSDN认证企业博客

码龄14年

20: 原创

111万+: 周排名

159万+: 总排名

5万+: 访问

: 等级

802: 积分

15: 粉丝

18: 获赞

4: 评论

33: 收藏

私信

关注

热门文章

分类专栏

最新评论

Coursera
T_Rer_: 可以问一下网站上的撤课操作吗？我没找到应该在哪里操作。课程不适合我。
关于点到直线距离的理解
-----小: 我表示如果这些理解都是作者自己思考出来的那作者数学应该很不错吧
大规模优化算法 - LBFGS算法
wodesitanfu: 图片都没了，重新写个看看博主

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。