python机器学习-随机森林
随机森林算法原理
随机森林分类器最早由Leo Breiman和Adele Cutler提出,指的是利用多棵树对样本进行训练并预测的一种分类器。采用的原理是“集思广益”,当一颗决策树的预测效果不稳定时,采用多颗决策树构成“森林”的思想来提高模型的决策能力。
随机森林的建模步骤(X-MIND)
从分叉树的角度(图片取自百度百科)
机器学习随机森林接口介绍
from sklearn.ensemble import RandomForestClassifier
estimator= RandomForestClassifier()
##参数
网格搜索和交叉验证
- 交叉验证法:
将原始数据集进行多次划分,得到n个验证集和n个测试集合,分别对n个不同划分的数据集合进行训练和建模,得到n个预测结果,n个结果的平均值作为最终的分类结果。
- 网格搜索法介绍
网格搜索算法是一种通过遍历给定的参数组合来优化模型表现的方法,自动遍历我们给定的超参数,从而得到范围内的最优模型。