周志华《机器学习》读书记录

最新推荐文章于 2024-07-27 23:44:59 发布

GundamDyname

最新推荐文章于 2024-07-27 23:44:59 发布

阅读量1.2k

点赞数

分类专栏：机器学习周志华文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011500178/article/details/81300875

版权

机器学习周志华专栏收录该内容

3 篇文章 0 订阅

订阅专栏

周志华《机器学习》读书记录（8）第八章集成学习课后习题

这章主要讲了融合算法包括1.Boosting（Adaboost）将一个弱学习器提升为强学习器2.Bagging（并行式集成学习）让我没想到的是随机森林算法也是并行式集成学习的一种，看来我的理解还是很差。
课后习题：

1.假设硬币正面朝上的概率为p，反面朝上的概率为1-p。令H(n)代表抛n次硬币所得正面朝上的次数，则最多k次正面朝上的概率试推导出(8.3)。

2.对于0/1损失函数来说，指数损失函数并非仅有的一致替代函数。考虑式(8.5)，试证明:任意随机函数 $l(−H(x)f(x))$ ，若对于 $H(X)$ 在区间 $[−∞,δ](δ>0)$ 上单调递减，则 l <script type="math/tex" id="MathJax-Element-28">l</script>是0/1损失函数的一致替代函数。

3.自己编程实现一个AdaBoost,以不剪枝决策树为基学习器，在西瓜数据集3.0α上训练一个AdaBoost集成，并与图8.4比较。

4.GradientBoosting是一种常用的Boosting算法，是分析其与AdaBoost的异同。

GradientBoosting与AdaBoost相同的地方在于要生成多个分类器以及每个分类器都有一个权值，最后将所有分类器加权累加起来
不同在于：
AdaBoost通过每个分类器的分类结果改变每个样本的权值用于新的分类器和生成权值，但不改变每个样本。
GradientBoosting将每个分类器对样本的预测值与真实值的差值传入下一个分类器来生成新的分类器和权值(这个差值就是下降方向)，而每个样本的权值不变。

5.试编程实现Bagging,以决策树桩为学习器，在西瓜数据集3.0α上训练一个Bagging集成，并与8.6进行比较。

6.试述为什么Bagging难以提升朴素贝叶斯分类器的性能。

Bagging主要是降低分类器的方差，而朴素贝叶斯分类器没有方差可以减小。对全训练样本生成的朴素贝叶斯分类器是最优的分类器，不能用随机抽样来提高泛化性能。

7.试述随即森林为什么比决策树Bagging集成的训练速度快

随机森林不仅会随机样本，还会在所有样本属性中随机几种出来计算。这样每次生成分类器时都是对部分属性计算最优，速度会比Bagging计算全属性要快。

8.MultiBoosting算法与Iterative Bagging的优缺点。

MultiBoosting由于集合了Bagging，Wagging，AdaBoost，可以有效的降低误差和方差，特别是误差。但是训练成本和预测成本都会显著增加。
Iterative Bagging相比Bagging会降低误差，但是方差上升。由于Bagging本身就是一种降低方差的算法，所以Iterative Bagging相当于Bagging与单分类器的折中。

9.试设计一种可视化多样性度量，并与k-误差图比较。

10.试设计一种能提升k近邻分类器性能的集成学习算法。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。