机器学习笔记 - 互信息（Mutual Information）

最新推荐文章于 2024-03-03 23:11:19 发布

PzBlockchain

最新推荐文章于 2024-03-03 23:11:19 发布

阅读量1.1k

点赞数

文章标签：机器学习笔记人工智能机器学习-深度学习

本文链接：https://blog.csdn.net/PzBlockchain/article/details/133214030

版权

机器学习-深度学习专栏收录该内容

93 篇文章 ¥59.90 ¥99.00

订阅专栏

互信息是衡量两个随机变量相关性的信息论指标，在机器学习中用于特征选择、聚类和降维。本文探讨互信息的概念、计算方法，并提供Python代码示例，展示如何在特征选择、聚类评估和降维中应用互信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

互信息是信息论中一种重要的度量方式，用于衡量两个随机变量之间的相关性。在机器学习中，互信息常被用于特征选择、聚类和降维等任务。本文将介绍互信息的概念和计算方法，并提供相应的源代码示例。

概念

互信息是用来衡量两个随机变量之间的相关性程度的指标。给定两个离散随机变量X和Y，它们的互信息定义为它们联合分布与各自边缘分布之间的差异。互信息可以表示为以下公式：

I(X;Y) = ΣΣ p(x,y) * log(p(x,y) / (p(x) * p(y)))

其中，p(x,y)表示X和Y的联合概率分布，p(x)和p(y)分别表示X和Y的边缘概率分布。

计算方法

为了计算互信息，我们需要估计X和Y的联合概率分布和边缘概率分布。在实际应用中，我们通常使用样本数据来估计概率分布。

以下是一个简单的示例，展示了如何使用Python计算两个离散随机变量的互信息：

import numpy as np

def mutual_information(X

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

PzBlockchain

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

机器学习笔记 - 互信息Mutual Information

学以致用知行合一

07-04

4328

遇到一个新的数据集时重要的第一步是使用特征效用指标构建排名，该指标是衡量特征与目标之间关联的函数。然后，您可以选择一小部分最有用的功能进行初始开发。我们将使用的度量称为“互信息”。互信息很像相关性，因为它衡量两个量之间的关系。互信息的优点是它可以检测任何一种关系，而相关性只检测线性关系。 互信息是一个很好的通用指标，在功能开发开始时特别有用，因为您可能还不知道要使用哪种模型。 互信息易于使用和解释，计算效率高，理论上有根据，抗过拟合，并且能够检测任何类型的关系。

概率机器学习中的互信息（Mutual Information）

ZJ_____W的博客

03-30

1719

概率机器学习中的互信息（Mutual Information）

1 条评论您还未登录，请先登录后发表或查看评论

机器学习_互信息的理解

m0_38034312的博客

03-18

782

【1】.http://www.fuzihao.org/blog/2015/01/17/%E4%BA%92%E4%BF%A1%E6%81%AF%E7%9A%84%E7%90%86%E8%A7%A3/【2】原来我对X有些不确定(不确定性为H(X))，告诉我Y后我对X不确定性变为H(X|Y), 这个不确定性的减少量就是X,Y之间的互信息I(X;Y)=H(X)-H(X|Y)。...

11.互信息-机器学习模型性能的常用的评估指标

最新发布

qq_37977007的博客

03-03

851

简单介绍聚类算法的评估指标-互信息

机器学习基础知识—互信息理解

qq_40707174的博客

11-18

866

互信息的理解我们在之前研究过两个随机变量的独立性，我们定义若两个随机变量X,Y满足 P(X,Y)=P(X)P(Y) 则我们说随机变量X,Y独立。下面来直观地理解这个公式，可以发现，如果X,Y独立，那么已知X，将不会对Y的分布产生任何影响，即是说P(Y)=P(Y|X)，这个结果的证明也很简单，由贝叶斯公式：即证。由此可以看出，独立性反应了已知X的情况下，Y的分布是否会改变，或者说，在给定...

[Machine Learning]--PMI(Pointwise Mutual Information)

beijingbuaaer的博客

09-16

1597

[Machine Learning]--PMI(Pointwise Mutual Information)

machine learning学习笔记（一）：信息熵，条件熵，交叉熵，KL散度，互信息

m0_37754282的博客

10-02

994

琴生不等式 Jensen 由数学归纳法证明对损失函数 Logarithmic function entropy 信息熵 log底数一般为2.信息熵代表着X不确定程度。

特征选择过滤器 - mutual_info_regression（连续目标变量的互信息）

壮壮不太胖的学习笔记

05-18

9258

文章目录函数参数说明函数 sklearn.feature_selection.mutual_info_regression(X, y, discrete_features='auto', n_neighbors=3, copy=True, random_state=None) 估计一个连续目标变量的互信息。两个随机变量之间的互信息（MI）是非负值，用于衡量变量之间的依存关系。当且仅当两个随机变量是独立的，并且等于较高的值意味着较高的依赖性时，它等于零。该函数依赖于非参数方法，该方法基于k-邻近邻居距

特征选择过滤器 -mutual_info_classif（离散目标变量的互信息）

壮壮不太胖的学习笔记

05-18

9339

文章目录函数参数说明官网：sklearn.feature_selection.mutual_info_classif 函数 sklearn.feature_selection.mutual_info_classif(X, y, discrete_features='auto', n_neighbors=3, copy=True, random_state=None)[source] 估计离散目标变量的互信息。两个随机变量之间的互信息（MI）[1]是非负值，用于衡量变量之间的依存关系。当且仅当两个随机变

计算两个向量的互信息(Mutual Information) matlab程序

03-19

计算两个向量的互信息(Mutual Information) matlab程序

互信息的计算

01-21

互信息(Mutual Information)是信息论里一种有用的信息度量，它可以看成是一个随机变量中包含的关于另一个随机变量的信息量，或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性.综合网上的一些有关互信息的计算，这里一共提供7种不同的程序供大家参考；后期可以继续交流。

互信息计算_互信息的计算_

10-03

已知：信源符号为英文字母（不区分大小写）和空格。输入：一篇英文的信源文档（5000词以上）。输出：列出每两个字母之间的互信息并计算平均互信息（输出到文本文件中）。

matlab几种计算互信息的方法

10-28

里面包含几种用于matlab计算两个序列之间的互信息的方法，用于评价变量之间的耦合程度，可以参考和学习。

互信息计算matlab代码-Mutual-information-code:互信息的计算代码是用Matlab编写的

05-28

互信息计算matlab代码互信息代码 互信息的计算代码是用Matlab编写的。 互信息是衡量一个随机变量告诉我们另一个变量的数量的其中之一。它是具有（通常）比特单位的无量纲量，并且可以被认为是在已知另一个随机变量的情况下，其不确定性的降低。相互之间的信息丰富，表明不确定性大大降低；相互信息量低表示减少幅度很小；两个随机变量之间的相互信息为零意味着变量是独立的。

互信息MATLAB程序代码

01-04

医学图像配准，采用互信息配准的MATLAB程序代码

机器学习特征筛选：互信息法（mutual information）

data+scenario+science+insight

08-28

7785

机器学习特征筛选：互信息法（mutual information） 互信息法多为分类问题的分类变量的筛选方法经典的互信息也是评价定性自变量对定性因变量的相关性的，为了处理定量数据，最大信息系数法被提出，互信息计算公式如下： # mutual information # 互信息法 # 自己手写理论公式实现功能 # np.where(condition, x, y) # 满足条件(condition)，输出x，不满足输出y。 # numpy.intersect1d(ar1, ar2.

一文讲透Python机器学习特征选择之互信息法

m0_72274883的博客

11-28

3658

互信息量度的是特征变量X和响应变量y共享的信息，或者说知道这两个变量其中的一个，对另一个不确定度减少的程度。因此，如果特征变量X和响应变量y相互独立，则知道特征变量X将不对响应变量y提供任何信息，反之亦然，此时特征变量X和响应变量y的互信息为零。而如果特征变量X是响应变量y的确定性函数，响应变量y也是特征变量X的确定性函数，比如y=aX+B，那么此时传递的所有信息都被特征变量X和响应变量y共享，或者说知道特征变量X将可以完全预测响应变量y，则此时特征变量X和响应变量y的互信息为最大。

[Python嗯~机器学习]---对互信息的理解

kepengs的博客

01-25

3754

互信息 通过上图可以看出，所谓互信息就是两个事件都有的信息量。于是，在互信息定义的基础上使用jessen不等式，我们可以证明是非负的，因此，这里我们给出的详细推导：上面其他性质的证明类似。　　直观地说，如果把熵看作一个随机变量不确定度的量度，那么就是没有涉及到的的部分的不确定度的量度。这就是“在已知之后的剩余不确定度的量”，于是第一个等式的右边就...

互信息

shiyutianming的博客

03-15

412

https://www.cnblogs.com/gatherstars/p/6004075.html