机器学习 --- 随机森林

最新推荐文章于 2024-08-16 19:36:23 发布

川师_King

最新推荐文章于 2024-08-16 19:36:23 发布

阅读量2.9k

点赞数 13

分类专栏： Educoder机器学习编程题解析

本文链接：https://blog.csdn.net/weixin_44196785/article/details/110502376

版权

简介
随机森林是 Bagging 的一种扩展变体。该算法由于实现简单，抗噪声能力强，不容易发生过拟合现象，因此在很多业务中被广泛应用。
本实训项目的主要内容是基于 python 语言搭建出随机森林模型，并使用 sklearn 实现手写数字识别。

Bagging

import numpy as np
from sklearn.tree import DecisionTreeClassifier


class BaggingClassifier(object):
    def __init__(self, n_model=10):
        '''
        初始化函数
        '''
        # 分类器的数量，默认为10
        self.n_model = n_model
        # 用于保存模型的列表，训练好分类器后将对象append进去即可
        self.models = []

    def fit(self, feature, label):
        '''
        训练模型，请记得将模型保存至self.models
        :param feature: 训练集数据，类型为ndarray
        :param label: 训练集标签，类型为ndarray
        :return: None
        '''
        self.models = [DecisionTreeClassifier(max_depth=3).fit(feature, label) for _ in range(self.n_model)]

    def predict(self, feature):
        '''
        :param feature: 测试集数据，类型为ndarray
        :return: 预测结果，类型为ndarray，如np.array([0, 1, 2, 2, 1, 0])
        '''
        tmp_arr = np.transpose([clf_.predict(feature) for c