刚看到一篇介绍特征筛选的文章,里面介绍基于模型的特征排名,附加了一个随机森林的python程序,感觉挺好,赶紧mark下来。
程序使用了skliearn机器学习库,数据集为boston房屋价格数据,源程序如下所示:
from
sklearn.cross_validation
import
cross_val_score, ShuffleSplit
from
sklearn.datasets
import
load_boston
from
sklearn.ensemble
import