机器学习之集成学习（三）Boosting回归算法实现

最新推荐文章于 2022-04-18 09:41:11 发布

繁华三千东流水

最新推荐文章于 2022-04-18 09:41:11 发布

阅读量4.8k

点赞数 3

分类专栏：机器学习算法思想及代码实现文章标签：机器学习集成学习 boosting算法

本文链接：https://blog.csdn.net/qq872890060/article/details/99688536

版权

机器学习算法思想及代码实现专栏收录该内容

57 篇文章 17 订阅

订阅专栏

集成模型一览

在这里插入图片描述

boosting思想

先构建，后结合
个体学习器之间存在强依赖关系，一系列个体学习器基本都需要串行生成，然后使用组合策略，得到最终的集成模型，这就是boosting的思想

boosting回归例题

在这里插入图片描述
注：每一轮的训练集发生变化（标签变为了残差），即下一个模型要基于新训练集进行学习，学习完毕后，将所有模型简单叠加，就得到了最终模型

代码实现

import pandas as pd
from sklearn.tree import DecisionTreeRegressor

df = pd.DataFrame([[1,5.56],[2,5.7],[3,5.91],[4,6.4],[5,6.8]
                   ,[6,7.05],[7,8.9],[8,8.7],[9,9],[10,9.05]],columns=["x","y"])

M = [] # 存储决策树模型的数组
n_trees = 6  # 设置树的颗数
X = df.iloc[:,:-1] # 获取全部数据的X
Y = pd.Series(df['y'])


for i in range(n_trees):
    model = DecisionTreeRegressor(max_depth=2)  # 新建决策树模型
    model.fit(X,Y)
    # 将决策树模型加入数组
    M.append(model)
    Y_het = model.predict(X) # 输出模型预测值
    Y = Y - Y_het


res = 0 # 初始化全零向量
for i in M: # 遍历模型数组
    res += i.predict(X) # 将每个模型预测值叠加到res变量
# 输出最终对每个样本标签的预测值
print(res)
'''
# 效果
[5.56       5.7        5.91       6.4        6.8        7.05
 8.91388889 8.73055556 8.95555556 9.05      ]
'''

繁华三千东流水

关注

3
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
机器学习之集成学习（三）Boosting回归算法实现

集成学习是训练一系列学习器，并使用某种结合策略把各个学习结果进行整合，从而获得比单个学习器更好的学习效果的一种方法。如果把单个学习器比作一个决策者的话，集成学习的方法就相当于多个决策者共同进行一项决策。集成模型不是单独的ML模型，而是通过先构建后结合多个ML模型来完成学习任务
复制链接

扫一扫

专栏目录