MIC
我在论文使用MIC来衡量两个基因之间的关联程度,线性或非线性关系,相较于Mutual Information(MI)互信息而言有更高的准确度巴拉巴拉的,按作者的话说总之比其他的方式好。
原文参照:
Detecting Novel Associations in Large Data Sets
相关东西自己看看人家原文,一直觉得人家歪果仁写东西很认真,基础提到,实验充足…英文可以的话,尽量多读读歪果仁写的东西,提升很大…
直接进入主题
MIC概念解释
在了解MIC概念之前,你需要知道MI的概念、如何计算,一句话概括:衡量两信息的相似程度,相似程度越高,值越大;反之亦然!至于MI的计算,网上一搜一大堆,自己研究去吧…
先来看看MIC的定义:
一大串公式代表什么意思?有一篇文章介绍这个,忘了出处了!这里借用一下
MIC计算分为三个步骤:
- 给定i、j,对XY构成的散点图进行i列j行网格化,并求出最大的互信息值
- 对最大的互信息值进行归一化
- 选择不同尺度下互信息的最大值作为MIC值
(1) 给定i、j,对XY构成的散点图进行i列j行网格化,并求出最大的互信息值
值得注意的是,给定i和j后,可以得出多种不同的网格化方案。我