随机森林

Y.Z-Rus

于 2019-09-08 09:44:21 发布

阅读量144

点赞数

分类专栏：机器学习(常见算法)

本文链接：https://blog.csdn.net/weixin_44644097/article/details/100620206

版权

机器学习(常见算法) 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

随机森林由多棵决策树构成，可以对样本集合进行多次有放回的采样，并构建相应的决策树, 对于预测样本，遍历每一刻决策树，记录相应结果, 采取相应的总结方法, 总结结果作为随机森林的输出

import numpy as np
from .DT import DecisionTree

#抽样自助
def bootstrap_sample(X, Y):

    N, M = X.shape
    idxs = np.random.choice(N, N, replace=True)
    return X[idxs], Y[idxs]

class RandomForest:

    def __init__(self, n_trees, max_depth, n_feats, classifier=True, criterion="entropy"):
    
        self.trees = [] # 存放决策树
        self.n_trees = n_trees  # 决策树的数目
        self.n_feats = n_feats  # 选取的特征数
        self.max_depth = max_depth  # 树的深度
        self.criterion = criterion   # 划分属性准则
        self.classifier = classifier

    def fit(self, X, Y):
        # 训练多颗决策树
        self.trees = []
        for _ in range(self.n_trees):
            X_samp, Y_samp = bootstrap_sample(X, Y)
            tree = DecisionTree(n_feats=self.n_feats,
                                max_depth=self.max_depth,
                                criterion=self.criterion,
                                classifier=self.classifier)
            tree.fit(X_samp, Y_samp)
            self.trees.append(tree)

    def predict(self, X):
        # 返回一个二维矩阵 每一行为一个决策树对预测样本的输出 维度 n_trees * X.shape[0]
        tree_preds = np.array([[t._traverse(x, t.root) for x in X] for t in self.trees])
        return self._vote(tree_preds)

    def _vote(self, predictions):

        if self.classifier:
            out = [np.bincount(x).argmax() for x in predictions.T]
        else:
            out = [np.mean(x) for x in predictions.T]
        return np.array(out)

Y.Z-Rus

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
随机森林

随机森林由多棵决策树构成，可以对样本集合进行多次有放回的采样，并构建相应的决策树, 对于预测样本，遍历每一刻决策树，记录相应结果, 采取相应的总结方法, 总结结果作为随机森林的输出import numpy as npfrom .DT import DecisionTree#抽样自助def bootstrap_sample(X, Y): N, M = X.shape ...
复制链接

扫一扫