此实验中数据比较简单,主要是为了分析梯度提升树执行的原理
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
# 回归是分类的极限思想
# 分类的类别多到一定程度,就是回归
from sklearn.ensemble import GradientBoostingClassifier,GradientBoostingRegressor
from sklearn import tree
# X数据:上网时间和购物金额
# y目标:14 16, 24,26
X = np.array([[800,3],[1200,1],[1800,4],[2500,2]])
y = np.array([14,16,24,26])
gbdt= GradientBoostingClassifier(n_estimators=10)
gbdt.fit(X, y)
gbdt.predict(X)
gbdt[0,0].predict(X)
gbdt[-1,0].predict(X)
# 使用回归
gbdt = GradientBoostingRegressor(n_estimators=10)
gbdt