Randomw Forest算法 python实现,该系列文章主要是对常见的机器学习算法的实现。
完整的笔记和代码以上传到Github,地址为(觉得有用的话,欢迎Fork,请给作者个Star):
https://github.com/Vambooo/lihang-dl
随机森林 Random Forest
随机森林是对多棵树组合对样本训练预测的一种分类器,它是Bagging方法的最流行的版本之一。
可以理解为随机森林是个体模型为决策树的Bagging算法。
随机森林由Breiman提出的一种分类算法,它使用Bootstrap重采样技术,从原始训练样本集中有放回的重复随机抽取n个样本生成新的样本集合,以此作为训练集来训练决策树。然后按照上述步骤生成m棵决策树组合而成随机森林。
随机森林算法
Random Forest算法案例 python实现
(代码可以左右滑动看)
第一步:构建数据(这里用make_blobs()来构建聚类数据)
X, y = make_blobs(n_samples=3000, centers=2, random_state=42, cluster_std=1.0)
n_samples是待生成的样本的总数;
n_features是每个样本的特征数;
centers表示类别数;
cluster_std表示每个类别的方差。
from sklearn.datasets import make_blobs
X, y