DISR用途
DISR可用于特征筛选,该方法可以将 Variable Complementarity 纳入考虑,即考虑了多个变量联合作用与因变量的相关性,而不是仅仅考虑到单个变量与因变量的相关性。
例子1
假设有4个变量,因变量,自变量 ,其中,而。因此和 的和 相关,而 和 高度相关。( 和 就是 Variable Complementarity)
信息冗余会降低计算得到的条件互信息
但实际上 并不一定和 不相关,这是由于 和 高度相关造成的。
通过添加条件,可以提高 和 的条件互信息
所以条件互信息受到两个变量是互补(Complementarity)还是冗余的影响,那么有没有更直观的方法去判断两个变量的互补关系呢?
两个自变量关于因变量的互补性定义为:
当 , 和 关于 互补;当 , 和 关于 相互冗余。
例子2
计算XOR运算种两个变量的互补性
X1 | 1 | 1 | 0 | 0 |
X2 | 1 | 0 | 1 | 0 |
Y | 0 | 1 | 1 | 0 |
计算得到
因此 和 关于 互补。
Double Input Symmetrical Relevance
DISR计算过程
将上述式子 进行变移项得到
其中, 包括了 和 各自关于 的相关性,以及 和 关于 的互补性。因此可以 进行特征变量的筛选。选择过程和前向选择法类似。
第一个变量可以将与 互信息最大的特征加入到集合 中,然后依次计算 ,并将值最大的特征变量加入到集合 中,直到达到设定好的集合 大小。即定义为:
但是使用 的取值范围是0~+∞,所以可以使用对称相关性(Symmetrical Relevance, SR)代替,其取值范围为0~1。
最后,
注意事项
DISR要求特征变量是离散的,需要对连续变量进行离散化处理。
参考资料
[1] b69b81126b7d1a5712101e16271d177ccdb8.pdf (semanticscholar.org)
[2] R: Double input symmetrical relevance filter (r-project.org)