机器学习实战-AdaBoost-python代码

最新推荐文章于 2019-01-08 17:31:01 发布

黄豆喵风控

最新推荐文章于 2019-01-08 17:31:01 发布

阅读量266

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/lonzzy/article/details/78844924

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Boostrap只是提供了一种组合方法的思想，就是将基分类器的训练结果进行综合分析。Bootstrap并不是一种机器学习的训练算法，而是一种自助采样的算法，用小样本数据集估计整体的非参数方法。
而其它的名称如Bagging、oosting是对组合方法的具体演绎。

第一种，通过处理训练数据集。这种方法根据某种抽样分布，通过对原始数据集进行再抽样来得到多个数据集。抽样分布决定了一个样本被选作训练的可能性大小，然后使用特定的学习算法为每个训练集建立一个分类器。Bagging袋装和Boosting提升都是这样的思想。Adaboost是Boosting当中比较出众的一个算法。
第二种，通过处理输入特征。在这种方法中，通过选择输入特征的子集来形成每个训练集。随机森林就是通过处理输入特征的组合方法，并且它的基分类器限制成了决策树。

High variance是model过于复杂overfit,记住太多细节noise,受outlier影响很大；
High