梯度提升回归模型(HistGradientBoostingRegressor),它可以用于分析和预测连续型的数值型数据。通常在回归问题中,该模型可以用于预测因变量(连续型数值型)和自变量(特征)之间的关系,例如预测股票价格、房价等数值型数据的变化趋势。
在本例中,我们使用该模型对中国生产者物价指数(PPI)的未来走势进行了预测。通过对历史数据的学习,该模型可以预测未来PPI的变化趋势,帮助决策者做出更为准确的决策。
import pandas as pd
import numpy as np
from sklearn.ensemble import HistGradientBoostingRegressor
from sklearn.metrics import mean_squared_error
# 读取数据
df = pd.read_csv('G:/statistics/China_PPI(2011_2022).csv')
# 特征工程
df['month'] = pd.to_datetime(df['month'].astype(str), format='%Y%m')
df['month_diff'] = df['month'].diff().dt.days
df['ppi_yoy_lag1'] = df['ppi_yoy'].shift(1)
df['ppi_yoy_lag2'] = df['ppi_yoy'].shift(2)
df['ppi_yoy_lag3'] = df['ppi_yoy'].shift(3)
df['ppi_yoy_ma3'] = d