GBT(渐进增强决策树)预测电池容量的工作原理:
GBT模型可以看成是一个决策树组队。它训练出一组决策树,每一棵决策树负责预测电池容量的一个“补丁”。
第一个决策树根据输入变量,生成一个电池容量的初始预测。但这个预测可能还不够准确。
所以第二棵决策树会专注于第一个树预测误差比较大的数据,给它们建立新的决策规则,得到一个“补丁”,补充第一个树的预测。
后面每棵决策树都在前面树的基础上,针对残差较大的部分生成补丁,一步步纠正和改进预测。
最后,把每棵决策树的预测结果加起来,就可以得到整体对电池容量很准确的预测。
GBT模型通过组合多个决策树,让每个决策树只负责本地化的预测任务,避免单一树过于复杂,从而总体提升了预测性能。
这种增强模型的思路与人们分工协作解决复杂问题的方式类似。
代码:
# gbt_model.py
import pandas as pd
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, mean_absolute_error,r2_score
import matplotlib.pyplot as plt
# 加载数据
data = pd.read_csv('battery_capacity_prediction_data.csv')
X = data[['涂布速度', '涂层间隙', '浆料重量百分比', '表面张力', '浆料密度', '干密度', '涂层粘度']]
y = data['电池容量']
# 分割数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建GBT模型
gbt = GradientBoostingRegressor(n_estimators=100, max_depth=5, min_samples_split=3)
# 训练及评估
gbt.fit(X_train, y_train)
y_pred = gbt.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
print('MAE:', mae)
print('MSE:', mse)
print('R2:', r2)
plt.rcParams['font.sans-serif']=['SimHei'] # 设置字体
plt.rcParams['axes.unicode_minus'] = False
# 绘制结果
plt.scatter(y_test, y_pred, c='b', label='预测值')
plt.scatter(y_test, y_test, c='r', label='真实值')
plt.legend()
# plt.xlabel('True Battery Capacity')
# plt.ylabel('Predicted Battery Capacity')
# plt.title('Gradient Boosting Regression')
ax = plt.gca()
ax.set_xlabel('电池容量真实值')
ax.set_ylabel('电池容量预测值')
ax.set_title('(c) 梯度提升决策树(GBT)')
ax.title.set_position([0.5, -0.18])
plt.tight_layout()
plt.show()