:第1个分类器的第 i 个样本的权重,初始样本的权重对第一个分类器都是
: 错误率,即分类错误概率的求和(预测值不等于真实值)
:分类器的权重,通过第二部的公式, 其取值范围为 0 到 1 , 的取值范围是 -1 到 1
1. 初始化 = ;
2. 在第 t 步, 选择可以最小化当前错误率 的弱分类器(也就是说,通过划分特征,一个个去分类,统计得到划分各个特征的错误率,然后选择错误率最低是分类器,这步主要是通过错误率 选择好的划分特征),并添加这个弱分类器, 以降低错误率(如果有弱分类器,那就创建一个),并计算 , = , 因为 是第i个样本的权重,全部样本相加得到第t个分类器的错误率,所以样本权重高的决定了这个分类器的权重。定义新的弱分类器为
3. 计算新的数据样本权重 , 如果真实值等于预测值,则权重减少,如果真实值不等于预测值,则权重增加(更加关注分类错误的样本,降低关注分类正确的样本)
4. 回到第2,直到收敛
5. 得到的模型为: