1、集成学习
集成学习是将多个机器学习的算法结合起来的一种方法,即实现将多个弱学习器通过组成一个整体来实现强学习的效果,俗语里:三个臭皮匠赛过一个诸葛亮。
2、Bagging算法
2.1 Bootstrap自助采样
在样本集D(样本数为m)中进行有放回的抽样,抽取数为m,则每次可能被抽取的概率为1/m,那么样本在m次采用中不被采样的概率为 ( 1 − 1 m ) m → lim n → ∞ ( 1 − 1 m ) m → 1 e ≈ 0.368 (1-\frac{1}{m})^m →\lim\limits_{n \to \infty}(1-\frac{1}{m})^m \to \frac{1}{e} ≈ 0.368 (1−m1