高精准的分类方法---Boosting

zhouxiuli1001

于 2018-09-13 15:48:55 发布

阅读量387

点赞数

分类专栏：数据挖掘 R 文章标签： R boosting

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhouxiuli1001/article/details/82689335

版权

数据挖掘同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

基本思想
回忆袋装技术：
根据重抽样自举法（各观测被抽到的概率相等1/n）建立k棵树，最后这k棵树各自对数据进行预测，预测结果根据少数服从多数规则得出最终结果。

对袋装技术的改进–boosting:
boosting也是进行重抽样，但是希望每次抽样，能较大概率的抽到预测错误的观测,即加入了权重的概念。
建模过程：
第1次抽样：各观测被抽到的概率相等，都是1/n，建立第1棵树，对数据进行预测，计算此时模型的预测错误率e1
第2次抽样：上一步预测正确的观测，被抽到的概率不变1/n；预测错误的观测被抽到的概率1/n*（1-e1）/e1,抽样结束后，建立第2棵树，对数据进行预测，计算此时模型的预测错误率e2
第3次抽样：重复第2步
…
当ei>0.5或ei=0时，停止迭代

预测过程：
对新数据进行预测时，k个模型各自分别进行预测，计算预测各自的预测误差率ei，进而得出各模型的权重wi: Breiman法：1/2log((1-ei)/ei）;Freund法：log((1-ei)/ei)
则新数据中，对于其中任一观测X，k个模型将有k个预测值ci和权重wi，对于分类问题，分别计算各类别的权重总和，最终取权重总和最高的类别作为预测结果。对于回归问题，最终取值=各预测值的加权平均值
R实现：
adabag包中的boosting 函数
boosting（输出变量名～输入变量名，data=数据框名，mfinal=重复次数，boos=TRUE,coeflearn=模型权重调整方法，control=参数对象名）

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
高精准的分类方法---Boosting

基本思想回忆袋装技术：根据重抽样自举法（各观测被抽到的概率相等1/n）建立k棵树，最后这k棵树各自对数据进行预测，预测结果根据少数服从多数规则得出最终结果。对袋装技术的改进–boosting: boosting也是进行重抽样，但是希望每次抽样，能较大概率的抽到预测错误的观测。建模过程：第1次抽样：各观测被抽到的概率相等，都是1/n，建立第1棵树，对数据进行预测，计算此时模型的...
复制链接

扫一扫

专栏目录

zhouxiuli1001 CSDN认证博客专家 CSDN认证企业博客

码龄9年

8: 原创

33万+: 周排名

207万+: 总排名

1万+: 访问

: 等级

281: 积分

7: 粉丝

3: 获赞

4: 评论

42: 收藏

私信

关注

热门文章

分类专栏

python 1篇
数据挖掘 8篇
统计分析 1篇
R 5篇

最新评论

Anaconda下更新Spyder
qq_17462909: 请教一下 Run current cell 4.0不能选中执行了，请问有解决办法吗
KNN
张志川: [code=python] --------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) <ipython> in <module>() 4 import pickle as pk 5 import numpy as np ----> 6 from julyedu.data_utils import load_CIFAR10 7 import matplotlib.pyplot as plt 8 get_ipython().magic('matplotlib inline') ~\Desktop\image linear classification\julyedu\data_utils.py in <module>() ----> 1 import Pickle as pickle 2 import numpy as np 3 import os 4 5 def load_CIFAR_batch(filename): ModuleNotFoundError: No module named 'Pickle' [/code]求大神指点这是怎么回事
kaggle心得
zhouxiuli1001 回复 icey_: 一起学习~
kaggle心得
icey_: 最近也看到这个题，没想到大佬的数据都已经处理完了。厉害呀，小白学习中。。。。。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。