集成学习方法（ensemble learning）（二）

最新推荐文章于 2023-10-19 23:42:23 发布

VIP文章 Wuchao_L

最新推荐文章于 2023-10-19 23:42:23 发布

阅读量697

点赞数

本文链接：https://blog.csdn.net/weixin_40156968/article/details/81666260

版权

由随机数组成的森林

**
sklearn.ensemble 模块包含两个基于随机决策树的平均算法： RandomForest 算法和 Extra-Trees 算法。这两种算法都是专门为树而设计的扰动和组合技术（perturb-and-combine techniques）。这种技术通过在分类器构造过程中引入随机性来创建一组不同的分类器。集成分类器的预测结果就是单个分类器预测结果的平均值。
与其他分类器一样，森林分类器必须拟合（fit）两个数组：保存训练样本的数组（或稀疏或稠密的）X，大小为 [n_samples, n_features]，和保存训练样本目标值（类标签）的数组 Y，大小为 [n_samples]:

>>> from sklearn.ensemble import RandomForestClassifier
>>> X = [[0, 0], [1, 1]]
>>> Y = [0, 1]
>>> clf = RandomForestClassifier(n_estimators=10)
>>> clf = clf.fit(X, Y)

同决策树一样，随机森林算法（forests of trees）也能用来解决多输出问题 （如果 Y 的大小是 [n_samples

最低0.47元/天解锁文章

Wuchao_L

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
集成学习方法（ensemble learning）（二）

**由随机数组成的森林** sklearn.ensemble 模块包含两个基于随机决策树的平均算法： RandomForest 算法和 Extra-Trees 算法。这两种算法都是专门为树而设计的扰动和组合技术（perturb-and-combine techniques）。这种技术通过在分类器构造过程中引入随机性来创建一组不同的分类器。集成分类器的预测结果就是单个分类器预测...
复制链接

扫一扫