Machine Learning Series No.7 -- Max Entropy

最新推荐文章于 2021-07-11 19:24:17 发布

bra_ve

最新推荐文章于 2021-07-11 19:24:17 发布

阅读量147

点赞数

分类专栏：机器学习原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bra_ve/article/details/82461157

版权

机器学习原理专栏收录该内容

10 篇文章 0 订阅

订阅专栏

最大熵模型

1.它是一个判别模型，最终目的是为了建模 $p(y|x)$ 。

2.原理

认为学习模型时，认为条件熵最大的模型是最好的模型。

其原理可由以下博客说明，其隐含的意思是指最好的模型是在满足已有约束的条件下，不做任何主观臆测的模型是最好的模型。

https://www.cnblogs.com/ooon/p/5677098.html

3.推导

E p ~ (f) = \sum x, y p ~ (x, y) f (x, y)

$E_{\tilde{p}}(f) = \sum_{x,y} \tilde{p}(x,y)f(x,y)$

E p (f) = \sum x, y p (x, y) f (x, y)

$E_{p}(f) = \sum_{x,y} p(x,y)f(x,y)$

条件熵：

H (Y | X) = H (X, Y) - H (X) = - \sum x, y p (x, y) log p (x, y) + \sum x p (x) log p (x)

$H(Y|X) = H(X,Y)-H(X) = -\sum_{x,y}p(x,y)\log p(x,y) + \sum_{x} p(x)\log p(x)$

= - \sum x, y p (x, y) log p (x, y) + \sum x, y p (x, y) log p (x)

$=-\sum_{x,y}p(x,y)\log p(x,y) + \sum_{x,y} p(x,y)\log p(x)$

= - \sum x, y p (x, y) log p ( x , y ) p ( x ) = - \sum x, y p (x, y) log p (y | x)

$= -\sum_{x,y}p(x,y)\log \frac{p(x,y)}{p(x)} = -\sum_{x,y}p(x,y)\log p(y|x)$

= \sum x, y p ~ (x) p (y | x) log p (x, y)

$= \sum_{x,y} \tilde{p}(x)p(y|x)\log p(x,y)$

在最后一步注意是为了建模 $p(y|x)$ .

所以最终的优化问题可以转化为：

max p \sum x, y p ~ (x) p (y | x) log p (x, y)

$\max_{p} \sum_{x,y} \tilde{p}(x)p(y|x)\log p(x,y)$

s . t . E p ~ (f i) = E p (f i)

$s.t.\ \ \ \ E_\tilde{p}(f_i) = E_p(f_i)$

\sum y p (y | x) = 1

$\sum_{y}p(y|x)=1$

最终转化为拉格朗日优化法求解：

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Machine Learning Series No.7 -- Max Entropy

最大熵模型1.它是一个判别模型，最终目的是为了建模p(y|x)p(y|x)p(y|x)。2.原理认为学习模型时，认为条件熵最大的模型是最好的模型。其原理可由以下博客说明，其隐含的意思是指最好的模型是在满足已有约束的条件下，不做任何主观臆测的模型是最好的模型。https://www.cnblogs.com/ooon/p/5677098.html3.推导Ep~(...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。