集成学习3-Boosting的原理和案例

最新推荐文章于 2024-07-05 09:24:10 发布

莫知我哀

最新推荐文章于 2024-07-05 09:24:10 发布

阅读量879

点赞数 1

分类专栏：集成学习文章标签： python 机器学习

本文链接：https://blog.csdn.net/weixin_43822124/article/details/115863685

版权

集成学习专栏收录该内容

6 篇文章 2 订阅

订阅专栏

1投票学习
2bagging

集成学习3-Boosting的原理和案例

bootsting原理
boosting 案例
boosting的特点

bootsting原理

如上图所示，问题是为了解决一个二分类问题，为此，我们选择一个深度为1的单层决策树进行训练

图1：
- 原始分布中，通过最小化代价函数（不纯度等），得到一个决策边界，可以看到，两个圆形被错误分类，因此要增加他们的权重，并且降低正确分类的样本的权重，变成图2的分布
图2 ：
- 由于上次模型训练中，错误分类的两个圆被赋予了更大的权重，因此产生了新的决策边界
- 将正确分类的两个大圆和全部三角形的权重进一步降低，增大错误分类的右上方三个圆的权重，分布如图3所示
图3：
- 产生新的分类边界
图4：
- 对1，2，3的分类结果进行多数投票，得到结果4

因此，简单地说，boosting就是通过不断地增大分类错误的样本的权重，降低分类正确的权重，从而生成不同的弱分类器，并通过多数投票等组合形式，得到最终分类结果。

boosting 案例

数据读取

# 引入数据科学相关工具包：
import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt
plt.style.use("ggplot")
%matplotlib inline
import seaborn as sns

# 加载训练数据：         
wine = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data",header=None)
wine.columns = ['Class label', 'Alcohol', 'Malic acid', 'Ash', 'Alcalinity of ash','Magnesium', 'Total phenols','Flavanoids', 'Nonflavanoid phenols', 
                'Proanthocyanins','Color intensity', 'Hue','OD280/OD315 of diluted wines','Proline']

# 数据查看：
print("Class labels",np.unique(wine["Class label"]))
wine.head()

Class labels [1 2 3]

	Class label	Alcohol	Malic acid	Ash	Alcalinity of ash	Magnesium	Total phenols	Flavanoids	Nonflavanoid phenols	Proanthocyanins	Color intensity	Hue	OD280/OD315 of diluted wines	Proline
0	1	14.23	1.71	2.43	15.6	127	2.80	3.06	0.28	2.29	5.64	1.04	3.92	1065
1	1	13.20	1.78	2.14	11.2	100	2.65	2.76	0.26	1.28	4.38	1.05	3.40	1050
2	1	13.16	2.36	2.67	18.6	101	2.80	3.24	0.30	2.81	5.68	1.03	3.17	1185
3	1	14.37	1.95	2.50	16.8	113	3.85	3.49	0.24	2.18	7.80	0.86	3.45	1480
4	1	13.24	2.59	2.87	21.0	118	2.80	2.69	0.39	1.82	4.32	1.04	2.93	735

数据划分

y = wine['Class label'].values
X = wine[['Alcohol','OD280/OD315 of diluted wines']].values

# 按8：2分割训练集和测试集
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.3,random_state=1,stratify=y)  # stratify参数代表了按照y的类别等比例抽样

弱分类器：单层决策树

# 使用单一决策树建模
from sklearn.tree import DecisionTreeClassifier
tree = DecisionTreeClassifier(criterion='entropy',random_state=1,max_depth = 1)
from sklearn.metrics import accuracy_score
tree = tree.fit(X_train,y_train)
y_train_pred = tree.predict(X_train)
y_test_pred = tree.predict(X_test)
tree_train = accuracy_score(y_train,y_train_pred)
tree_test = accuracy_score(y_test,y_test_pred)
print('Decision tree train/test accuracies %.3f/%.3f' % (tree_train,tree_test))

Decision tree train/test accuracies 0.597/0.611

adaboost

# 使用sklearn实现Adaboost(基分类器为决策树)
'''
AdaBoostClassifier相关参数：
base_estimator：基本分类器，默认为DecisionTreeClassifier(max_depth=1)
n_estimators：终止迭代的次数
learning_rate：学习率
algorithm：训练的相关算法，{'SAMME'，'SAMME.R'}，默认='SAMME.R'
random_state：随机种子
'''
from sklearn.ensemble import AdaBoostClassifier
ada = AdaBoostClassifier(base_estimator=tree,n_estimators=300,learning_rate=0.01,random_state=1)
ada = ada.fit(X_train,y_train)
y_train_pred = ada.predict(X_train)
y_test_pred = ada.predict(X_test)
ada_train = accuracy_score(y_train,y_train_pred)
ada_test = accuracy_score(y_test,y_test_pred)
print('Adaboost train/test accuracies %.3f/%.3f' % (ada_train,ada_test))

Adaboost train/test accuracies 0.855/0.852

结果对比

可以看到以二层决策树为弱分类器的adaboost模型，在训练集和测试集上，效果都略好于弱分类器分身
从下图分类边界曲线可以看到，adaboost的模型更加复杂，决策边界更加曲折，有可能产生过拟合

# 画出单层决策树与Adaboost的决策边界：
x_min = X_train[:, 0].min() - 1
x_max = X_train[:, 0].max() + 1
y_min = X_train[:, 1].min() - 1
y_max = X_train[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.1),np.arange(y_min, y_max, 0.1))
f, axarr = plt.subplots(nrows=1, ncols=2,sharex='col',sharey='row',figsize=(12, 6))
for idx, clf, tt in zip([0, 1],[tree, ada],['Decision tree', 'Adaboost']):
    clf.fit(X_train, y_train)
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    axarr[idx].contourf(xx, yy, Z, alpha=0.3)
    axarr[idx].scatter(X_train[y_train==1, 0],X_train[y_train==1, 1],c='blue', marker='^')
    axarr[idx].scatter(X_train[y_train==2, 0],X_train[y_train==2, 1],c='red', marker='o')
    axarr[idx].scatter(X_train[y_train==3, 0],X_train[y_train==3, 1],c='green', marker='x')
    axarr[idx].set_title(tt)
axarr[0].set_ylabel('Alcohol', fontsize=12)
plt.tight_layout()
plt.text(0, -0.2,s='OD280/OD315 of diluted wines',ha='center',va='center',fontsize=12,transform=axarr[1].transAxes)
plt.show()

当弱分类器变成强分类器时：

def fuc(max_depth=2):
    tree = DecisionTreeClassifier(criterion='entropy',random_state=1,max_depth =max_depth)
    ada = AdaBoostClassifier(base_estimator=tree,n_estimators=300,learning_rate=0.01,random_state=1)
    tree = tree.fit(X_train,y_train)
    y_train_pred = tree.predict(X_train)
    y_test_pred = tree.predict(X_test)
    tree_train = accuracy_score(y_train,y_train_pred)
    tree_test = accuracy_score(y_test,y_test_pred)
    print('Decision tree train/test accuracies %.3f/%.3f' % (tree_train,tree_test))

    ada = ada.fit(X_train,y_train)
    y_train_pred = ada.predict(X_train)
    y_test_pred = ada.predict(X_test)
    ada_train = accuracy_score(y_train,y_train_pred)
    ada_test = accuracy_score(y_test,y_test_pred)
    print('Adaboost train/test accuracies %.3f/%.3f' % (ada_train,ada_test))

    x_min = X_train[:, 0].min() - 1
    x_max = X_train[:, 0].max() + 1
    y_min = X_train[:, 1].min() - 1
    y_max = X_train[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.1),np.arange(y_min, y_max, 0.1))
    f, axarr = plt.subplots(nrows=1, ncols=2,sharex='col',sharey='row',figsize=(12, 6))
    for idx, clf, tt in zip([0, 1],[tree, ada],['Decision tree', 'Adaboost']):
        clf.fit(X_train, y_train)
        Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
        Z = Z.reshape(xx.shape)
        axarr[idx].contourf(xx, yy, Z, alpha=0.3)
        axarr[idx].scatter(X_train[y_train==1, 0],X_train[y_train==1, 1],c='blue', marker='^')
        axarr[idx].scatter(X_train[y_train==2, 0],X_train[y_train==2, 1],c='red', marker='o')
        axarr[idx].scatter(X_train[y_train==3, 0],X_train[y_train==3, 1],c='green', marker='x')
        axarr[idx].set_title(tt)
    axarr[0].set_ylabel('Alcohol', fontsize=12)
    plt.tight_layout()
    plt.text(0, -0.2,s='OD280/OD315 of diluted wines',ha='center',va='center',fontsize=12,transform=axarr[1].transAxes)
    plt.show()

fuc(2)

Decision tree train/test accuracies 0.903/0.852
Adaboost train/test accuracies 0.960/0.870

fuc(3)

Decision tree train/test accuracies 0.927/0.926
Adaboost train/test accuracies 1.000/0.852

output_7_1

从结果可以看出，当弱分类器的分类效果逐渐增强时，boosting模型逐渐变得过拟合，泛化能力变化不大

boosting的特点

 1. 可以降低模型的偏差
    2. 当若作为boosting的弱分类器分类能力比较强时，模型可能会出现过拟合现象，从而导致模型泛化能力下降。
    3. 计算成本较高，需要训练很多个弱分类器
    4. 无法进行并行计算，每一步的迭代都依赖于前一步

莫知我哀

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
集成学习3-Boosting的原理和案例

1投票学习2bagging集成学习3-Boosting的原理和案例bootsting原理boosting 案例数据读取数据划分弱分类器：单层决策树adaboost结果对比当弱分类器变成强分类器时：boosting的特点bootsting原理如上图所示，问题是为了解决一个二分类问题，为此，我们选择一个深度为1的单层决策树进行训练图1：原始分布中，通过最小化代价函数（不纯度等），得到一个决策边界，可以看到，两个圆形被错误分类，因此要增加他们的权重，并且降低正确分类的样本的权重，变成图2的分.
复制链接

扫一扫

专栏目录