随机森林
随机森林:多棵决策树构建而成,每一棵决策树都是上一篇文章中的决策树的原理,只是“随机森林”将其集成(ensemble)到了一起,因此,随机森林是一种“集成算法”
随机森林API
随机森林API:class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None, booststrap=True, rangdom_state=None)
- n_estimators:integer,optional(default=10),森林中树木的数量
- criterion:string,可选(default='gini')分割特征的测量方法,也可选用entropy,上一篇中有写到两者计算方法略有不同,但是效果类似
- max_depth:integer或None,可选,默认为“None”,树的最大深度
- bootstrap:boolean,optional(default=True),是否在构建树时使用放回抽样
随机森林优点
- 准确率高
- 不会过拟合
- 适用于大数据集,较常用
随机森林实操
import