特征工程 —— 特征重要性排序(Random Forest)

原创 2018年04月16日 23:16:43

树模型天然会对特征进行重要性排序,以分裂数据集,构建分支;

1. 使用 Random Forest

from sklearn.datasets import load_boston
from sklearn.ensemble import RandomForestRegressor


boston_data = load_boston()
X = boston_data['data']
y = boston_data['target']
    # dir(boston_data) ⇒ 查看其支持的属性为 ['DESCR', 'data', 'feature_names', 'target']
rf = RandomForestRegressor()
rf.fit(X, y)

print(sorted(zip(boston_data['feature_names'], map(lambda x: round(x, 4), 
                                                   rf.feature_importances_)),
             key=operator.itemgetter(1), reverse=True))
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/lanchunhui/article/details/79968363

数据结构基础系列(9):排序

数据结构课程是计算机类专业的专业基础课程,在IT人才培养中,起着重要的作用。课程按照大学计算机类专业课程大纲的要求,安排教学内容,满足需要系统学习数据结构的人。系列课程包含11个部分,本课为第9部分排序,介绍插入排序、交换排序、选择排序、归并排序、基数排序等各种排序算法,以及各种算法的性能分析。
  • 2015年11月25日 22:02

Notes—Random Forest-feature importance随机森林对特征排序

……未完待补充…… ref:http://blog.datadive.net/selecting-good-features-part-iii-random-forests/ two method...
  • code_caq
  • code_caq
  • 2017-07-01 16:10:23
  • 1927

python RandomForestClassifier 特征选取问题

RFclf :分类器;X:训练样本: RFclf.predict_proba(X):返回样本分类的概率 #sum(RFclf.predict_proba(X)) = 1 RFclf.trans...
  • u012560212
  • u012560212
  • 2016-11-30 13:39:36
  • 2546

细说RandomForest

鉴于csdn上已经有很多优秀的博文对RandomForest做过介绍,在此重复的内容我就不再复述:如随机森林的Bootstrap,features select... 主要结合原论文谈谈RandomF...
  • qccc_dm
  • qccc_dm
  • 2017-03-24 17:00:14
  • 1146

使用随机森林和mRMR进行特征选择

算法性能的好坏跟数据是密不可分的,因此找到一组更具代表性的特征子集显得更加重要。在实际项目中,因为有的特征对模型而言是冗余的,它对算法的性能会产生负面影响,此时就需要做特征选择。特征选择的目的就是从一...
  • wtq1993
  • wtq1993
  • 2016-05-30 19:03:04
  • 7436

Random Forest算法中的参数详解

本篇不是介绍RF的,关于RF网上有很多通俗易懂的解释 西瓜书与统计学习方法等很多教材中的解释也都足够 本篇仅针对如何使用sklearn中的RandomForestClassifier作记录 一、代...
  • qq_16633405
  • qq_16633405
  • 2017-02-28 14:46:05
  • 723

Random Forest 学习笔记整理

这篇文章是自己对学习random forest的整理,里面参考了很多其他博主的成果,非常感谢,他们的原文链接详见参考文献。 Random Forest,顾名思义,Random就是随机抽取,F...
  • Joyce0625
  • Joyce0625
  • 2014-05-07 16:13:49
  • 5548

spark mllib源码分析之随机森林(Random Forest)(二)

spark random forest源码分析系列之二,主要介绍特征、样本的处理
  • snaillup
  • snaillup
  • 2017-04-26 17:52:41
  • 1456

random forest

机器学习算法复习--随机森林 这里是截取曾经发表的http://www.cnblogs.com/wentingtu/archive/2011/12/13/2286212.html中一些内容 基...
  • qq_27231343
  • qq_27231343
  • 2016-06-09 16:21:42
  • 520

[特征工程系列一] 论特征的重要性

满打满算,还有十天左右就要过年了,这些天大家或多或少都有点浮躁。反过来想,趁大家都懈怠的时候,正是学习的最佳时机。趁着这几天,也给自己加点码,去认真的再看一下特征工程。我给自己列了下面的这一份学习清单...
  • gshengod
  • gshengod
  • 2018-02-01 18:08:20
  • 254
收藏助手
不良信息举报
您举报文章:特征工程 —— 特征重要性排序(Random Forest)
举报原因:
原因补充:

(最多只允许输入30个字)