原标题:特征选择:卡方检验
0 1
卡方检验是什么
卡方检验是一种统计量的分布在零假设成立时近似服从卡方分布的假设检验。在没有其他的限定条件或说明下,卡方检验一般指的是皮尔森卡方检验。——《维基百科》
上图表示分别在1、2、3、4、5的自由度下,卡方统计量(X轴)与P值(P-value,Y轴)之间的变化关系。
0 2
卡方检验与特征选择
特征选择是针对所要解决的问题从原始特征集选择到一组最佳的特征子集,具体包括删除无关的,冗余的,含有噪声的特征。
对于分类问题,在Filter方法中一般假设与分类目标独立的特征为无关特征,而 卡方检验可以进行 独立性检验,所以其适用于 特征选择。
K方检验做特征选择属于一种 Filter方法,如果检验结果是某个特征与标签独立,则可以删除该特征。
0 3
R语言实现卡方检验的特征选择
现在利用R语言实现卡方检验的特征选择。
参考代码如下:
##################
#特征选择&#