事物的属性从多个角度描述了事物,然而有的属性对于我们的目标是不重要的,或者起了反作用,这就需要我们从众多属性中,把这些捣蛋分子识别出来,保留下好用的属性。本文对属性选择做一下简单的总结,以备自己查询~
Feature Selection & Feature Extraction
属性选择(Feature Selection):重点在于选择,从已知的属性中选出需要的。
属性提取(Feature Extraction):重点在于提取,从已知的属性中产生新的属性。
Hypothesis
进行属性选择的前提假设:数据包含多余或者不相关的属性。
FS Method
属性选择大体分为三类:包装法(wrappers method),过滤法(filter method),嵌入法(embedded method)。
包装法:are a predictive model to score feature subset.使用误差率来评估。包装法将学习方法作为一个黑盒。
包装法示意图如下: