决策树系列5：AdaBoost 竟如此简单

最新推荐文章于 2020-04-05 21:40:36 发布

haoyutiangang

最新推荐文章于 2020-04-05 21:40:36 发布

阅读量549

点赞数

分类专栏：决策树机器学习文章标签：决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haoyutiangang/article/details/104827250

版权

引言

AdaBoost 其实很简单，就像我们参加模拟考试。

比如我们高考前要模拟考试10次，每次模拟完都需要分析各科的强弱，然后有针对性的复习，提升弱势科目，准备下一次模拟考试。

第一次考完发现物理化学较弱，复习时就给物理化学多一些时间。
第二次发现物理化学上去了，数学又相对较弱，复习时就多给数学一些时间。
依次类推，每次把相对较弱的科目多用些时间。

通过这十次模拟考试，相信我们的综合成绩会有很大的提升，在高考来临时一定能考出好成绩！

AdaBoost 简介

AdaBoost 全称 (Adaptive Boosting) 自适应增强，可以自适应地调整样本权重和分类器权重。

AdaBoost 由多个基本分类器组成，各个分类器顺序执行，每个后续分类器都根据前一个分类器的结果调整样本的权重，正确分类的样本调高权重，错误分类的样本调低权重。最后各个分类器根据分类器权重组合成最终分类器，给出分类结果。

在这里插入图片描述

AdaBoost 详解

问题描述：N 个样本的二分类问题, 类别 $\in \{1, -1\}$ 。

1. 初始化权重

起初 N 个样本中每个样本的权重 $w_i = \frac{1}{N}$ ，样本权重之和为 1.

2. 基本分类器

a. 根据样本权重 $w_{m,i}$ 构建基本分类器 $G_m$ （比如决策树, 这里下标 m 表示第几个分类器），利用基本分类器对样本进行分类：

分类正确时： $G_m(x_i) = y_i$
分类错误时： $G_m(x_i) \ne y_i$

b. 误差率 $e_m$ 为分类错误的样本权重之和

$e_m = \sum_{i=1}^N w_{m,i} I(G_m(x_i) \ne y_i)$

其中 $I (x)$ 用于计数：

$\begin{cases} 1,\quad x = True \\ 0,\quad x = False \end{cases}$

3. 计算权重

a. 分类器 $G_m$ 在最终多个分类器中的权重：
$\alpha_m = \frac12\,log\,\frac{1-e_m}{e_m}$

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
决策树系列5：AdaBoost 竟如此简单

引言AdaBoost 其实很简单，就像我们参加模拟考试。比如我们高考前要模拟考试10次，每次模拟完都需要分析各科的强弱，然后有针对性的复习，提升弱势科目，准备下一次模拟考试。第一次考完发现物理化学较弱，复习时就给物理化学多一些时间。第二次发现物理化学上去了，数学又相对较弱，复习时就多给数学一些时间。依次类推，每次把相对较弱的科目多用些时间。通过这十次模拟考试，相信我们的综合成绩会有...
复制链接

扫一扫

专栏目录

haoyutiangang CSDN认证博客专家 CSDN认证企业博客

码龄9年

79: 原创

4万+: 周排名

87万+: 总排名

13万+: 访问

: 等级

2077: 积分

188: 粉丝

165: 获赞

31: 评论

647: 收藏

私信

关注

热门文章

分类专栏

决策树 7篇
Hadoop实战 4篇
ZooKeeper
Flume 1篇
Kafka 2篇
Storm 2篇
项目基础 2篇
Hive 3篇
Java 2篇
Spark 1篇
算法 14篇
LeetCode 14篇
机器学习 48篇
深度学习 41篇
吴恩达 34篇

最新评论

深度学习系列6：卷积神经网络的反向传播
提莫队长刘谢文: 兄弟，请问解决了吗？是直接相加吗？
吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--编程作业
自向阳_: def compute_layer_style_cost(a_S, a_G): """ Arguments: a_S -- tensor of dimension (1, n_H, n_W, n_C), hidden layer activations representing style of the image S a_G -- tensor of dimension (1, n_H, n_W, n_C), hidden layer activations representing style of the image G Returns: J_style_layer -- tensor representing a scalar value, style cost defined above by equation (2) """ ### START CODE HERE ### # Retrieve dimensions from a_G (≈1 line) m, n_H, n_W, n_C = a_G.get_shape().as_list() # Reshape the images to have them of shape (n_C, n_H*n_W) (≈2 lines) a_S = tf.transpose(tf.reshape(a_S, [n_H * n_W, n_C])) a_G = tf.transpose(tf.reshape(a_G, [n_H * n_W, n_C])) # Computing gram_matrices for both images S and G (≈2 lines) GS = gram_matrix(a_S) GG = gram_matrix(a_G) # Computing the loss (≈1 line) J_style_layer = (1 / (2 * n_C * n_W * n_H) ** 2) * (tf.reduce_sum(tf.square(tf.subtract(GS, GG)))) ### END CODE HERE ###
深度学习系列6：卷积神经网络的反向传播
AgileFastx: 请问对于多filter的情况如何求dA
决策树系列3：信息增益、增益率、基尼系数 (史上最详尽)
Artemisia_Cain: 这里信息增益的举例算错了吧，应该是Ent(X|场地=室外)后面不应该是logbase2吗？log()这怎么直接用的lg来算啊，lg(1/2)才是0.3010。
吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--编程作业
qq_43724777: The Session graph is empty. Add operations to the graph before calling run().

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。