在使用pso处理多维数据的时候,预先要对数据进行排序,排序的方法,挑选的简单的,如下所示有几种。
上面是 1964年的ghiselli的论文采取的分类任务的子特征集的排序方法,Rcf是特征呵类别的关系,Rff是特征之间的关系,这个值越大越好。
虽然和我下面讲的无关。。。
1.爬山法(前向爬山(贪心地加),后向爬山(贪心地减))
显而易见就是控制变量(即某一个pso的粒子),改变某一维度发现效果如何,对效果改变最大的那个维度就是最重要的维度。依次下去进行排序。
但是初始化的变量可能会带来一些计算影响,解决的方法有如下两种
1.对一个特定粒子某一维度多次改变取均值
2.尝试多个初始化的变量(即尝试多个粒子),然后计算贡献度取得均值。
上述两种貌似是采用了数学的多个数据拟合得到结果的方法,采用尝试越多可能越精确。
2best first方法
是一种基于广度优先搜索的启发式方法。
3cfs方法
流程图如下
得到的结果进行下一步操作。