机器学习常用算法：最大熵模型

最新推荐文章于 2021-12-14 20:53:47 发布

Jessica__WEI

最新推荐文章于 2021-12-14 20:53:47 发布

阅读量680

点赞数

分类专栏：机器学习文章标签：数据挖掘分类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013402321/article/details/79355678

版权

最大熵原理

学习概率模型时，在所有可能的概率模型中，熵最大的模型是最好的模型。
假设离散随机变量 $X$ 的概率分布是 $P(X)$ ，则其熵为

H (P) = - \sum x P (x) log P (x)

$H(P) = - \sum_x P(x) \text{log} P(x)$

且满足如下不等式：

0 \leq H (P) \leq log | X |

$0 \le H(P) \le \text{log} |X|$

式中， $|X|$ 是 $X$ 的取值个数，当且仅当 $X$ 的分布是均匀分布时，右边等号成立，即当 $X$ 服从均匀分布时，熵最大。

最大熵原理可简述为按照满足约束条件下求等概率的方法估计概率分布。

最大熵模型

1.最大熵模型是由以下条件概率分布表示的分类模型，可用于二类或多分类问题。

P_{w} (y | x) = \frac{1}{Z_{w} (x)} exp (\sum_{i = 1}^{n} w_{i} f_{i} (x, y))

$P_w(y|x) = {1 \over Z_w(x)} \text{exp} (\sum_{i=1}^n w_if_i(x,y))$

Z w (x) = \sum y exp (\sum i = 1 n w i f i (x, y))

$Z_w(x) = \sum_y \text{exp} (\sum_{i=1}^n w_if_i(x,y))$
其中，

Zw(x) Z w ( x ) $Z_w(x)$ 是规范化因子；

wi w i $w_i$ 是特征权值；

fi(x,y) f i ( x , y ) $f_i(x,y)$ 是特征函数，描述输入

x x $x$ 和输出

y

$y$ 之间的某一个事实，其定义为

f (x, y) = {1, 0, x 与 y 满 足 某 一 事 实 否 则

$f(x,y) = \begin{cases} 1, & \text{$x$ 与 $y$ 满足某一事实} \\ 0, & \text{否则} \end{cases}$

这是一个二值函数。

2.对于给定的训练集 T={ (x1,y1),(x<

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习常用算法：最大熵模型

最大熵原理学习概率模型时，在所有可能的概率模型中，熵最大的模型是最好的模型。假设离散随机变量XXX 的概率分布是 P(X)P(X)P(X) ，则其熵为H(P)=−∑xP(x)logP(x)H(P)=−∑xP(x)logP(x) H(P) = - \sum_x P(x) \text{log} P(x) 且满足如下不等式：0≤H(P)≤log|X|0≤H(P)≤log|X...
复制链接

扫一扫

专栏目录

Jessica__WEI CSDN认证博客专家 CSDN认证企业博客

码龄11年

47: 原创

19万+: 周排名

153万+: 总排名

17万+: 访问

: 等级

1931: 积分

23: 粉丝

70: 获赞

15: 评论

336: 收藏

私信

关注

热门文章

分类专栏

python 8篇
c++ 1篇
Sublime Text 1篇
VIM 1篇
Shell 6篇
git 2篇
Hive 3篇
SQL 3篇
算法基础 4篇
机器学习 10篇
竞赛 1篇
编程工具 4篇
Spark 3篇

最新评论

Hive查询结果的几种保存方法
datagov: 不错，学习了
PyCharm中Jupyter Notebook的使用
qq_51402141: run cell 在哪里
pyspark的windows7环境搭建
overripethree49: 补充几点： 1. 如果你不打算用Scala语言编程，可以跳过第2步“安装scala，配置环境变量”。 2. hadoop最好也安装，反正占用空间也不大。按理说hadoop不是必须的，但是我尝试了下不安装hadoop，pyspark要出错。我没去研究原因和解决方法。 3. 第5步里，在执行 winutils.exe chmod -R 777 c:/tmp/Hive 的时候，如果这个目录不存在，自己创建一个。不然这个命令执行不了要报错。 4. 第6步其实就是在手动把pyspark和py4j安装到anaconda里去。我建议你直接在anaconda里面安装pyspark，py4j会自动伴随安装上，还不用自己修改配置文件。 5. 现在所有版本的Spark都支持python 3.7了。
shell中各种括号()、(())、[]、[[]]、{}的作用和区别
cacadang: 厉害
shell中各种括号()、(())、[]、[[]]、{}的作用和区别
DKN、柒桓叶: 牛逼！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。