该框架用来表示特征加权方法和选定的特征集,并探究这些特征如何i影响分类器的性能。该框架选用两个特征集的表征特性来分析对分类器性能的影响程度。它们分别是特征的累积信息增益和所选特征集向量的稀疏表示。
需要弄清的两个问题(即如何分析使用该框架对分类器性能的影响):
1.满足特征函数N--F(N)的随机生成的特征排序有多接近有给定的加权方案产生的原始特征排列
2.与原始排列等级的偏差在何种程度上影响分类器的性能。
该框架以朴素贝叶斯分类器为例,结合五种加权方案,验证了使用不同加权方案对NavieBayes分类器性能的影响程度,并与原始特征排列下的分类器性能作了比较,得出如下结论:当结合不同的特征加权方案和综合特征排序的情况下,分类的器的性能比原始特征排序时的性能更好。