目录
1 概念
随机森林:随机森林是包含多个决策树的分类器,并且其输出类别是由个别树输出的类别的众数而定
决策树见案例:https://blog.csdn.net/qq_36327687/article/details/84944850
2 优点
01 适合离散型和连续型的属性数据
02 对海量数据,尽量避免了过度拟合的问题
03 对高纬度的数据,不会出现特征选择困难的问题
04 实现简单,训练速度快,适合进行分布式计算
3 理论方法
# 随机森林生成方法:
rfcModel=RandomforestClassifier(
n_estimators=10,
max_leaf_nodes=None
)
n_estimators 森林中树的个数,默认值为10
max_leaf_nodes 统一设置树中最大的叶子节点数
# 随机森林训练以及预测方法
rfcModel.fit(featureData,targetData)
featureData 特征数据
targetData 目标数据
rfcModel.predict(featureData)
featureData