集成算法 — 梯度提升树GBDT(Python3.6实现)

本文介绍了梯度提升树(GBDT)的算法原理,GBDT通过每轮迭代训练弱分类器来减小上一轮的残差,形成加法模型。调参方面,重点讲解了GBDT特有的Boosting框架参数,并通过画学习曲线展示如何调整n_estimators参数。
摘要由CSDN通过智能技术生成

梯度提升树 GBDT(Gradient Boosting Decision Tree)

算法原理
GBDT通过每轮迭代产生一个弱分类器,新的弱分类器是通过减小上一轮分类器的残差训练得到的,从而不断提高分类器的精度,最终的总分类器是将每轮训练得到的弱分类器加权求和得到的(加法模型)。 GBDT每轮迭代的时候,都去拟合损失函数(在“损失函数”的博文中有详解)在当前模型下的负梯度,每轮训练的时候都能让损失函数尽快的减小和收敛达到局部最优解。因为GBDT 每轮的训练是在上一轮的训练的残差基础之上进行训练的,无论是分类还是回归都是使用的CART 回归树作为弱分类器。

调用模型

#GBDT分类模型
from sklearn import datasets
from sklearn.ensemble import GradientBoostingClassifier, GradientBoostingRegressor
from sklearn.model_selection import train_test_split, cross_val_score

iris = datasets.load_iris()
iris_x = iris.data
iris_y = iris.target

x_train, x_test, y_train, y_test = train_test_split(iris_x, iris_y, test_size = 0.3)

gbdt = GradientBoostingClassifier(loss = 'deviance', learning_rate = 0.5, n_estimators = 100, subsample = 1)
gbdt = gbdt.fit(x_train, y_train)
gbdt_result = gbdt.predict(x_test)
print(<
以下是使用Python实现使用梯度提升GBDT实现Boston房价预测的代码: ```python # 导入必要的库 import pandas as pd from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.ensemble import GradientBoostingRegressor from sklearn.metrics import mean_squared_error # 导入数据集 boston = load_boston() # 将数据集转换为DataFrame格式 df = pd.DataFrame(boston.data, columns=boston.feature_names) # 将目标值MEDV添加到DataFrame中 df['MEDV'] = boston.target # 将数据集分为训练集和测试集 x_train, x_test, y_train, y_test = train_test_split(df[boston.feature_names], df['MEDV'], test_size=0.2, random_state=42) # 构建GBDT模型 gbdt = GradientBoostingRegressor(n_estimators=100, learning_rate=0.1, max_depth=3, random_state=42) # 模型训练 gbdt.fit(x_train, y_train) # 模型评估 y_pred = gbdt.predict(x_test) mse = mean_squared_error(y_test, y_pred) print('MSE:', mse) # 预测房价 new_x = [[0.1, 18.0, 2.0, 0, 0.5, 6.0, 70.0, 3.0, 1.0, 305.0, 19.0, 390.0, 7.0]] new_y = gbdt.predict(new_x) print('Predicted MEDV:', new_y) ``` 以上代码中,使用load_boston()函数导入Boston房价数据集,然后将数据集转换为DataFrame格式,并将目标值MEDV添加到DataFrame中。使用train_test_split()函数将数据集分为训练集和测试集。使用GradientBoostingRegressor类构建GBDT模型,并使用fit()函数进行模型训练。使用mean_squared_error()函数对训练好的模型进行评估。最后,使用predict()函数对新的房屋特征进行预测,得到预测的房价。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值