决策树、随机森林之四，关于提升（一）

最新推荐文章于 2023-02-17 23:45:13 发布

youtaidudewamao

最新推荐文章于 2023-02-17 23:45:13 发布

阅读量265

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/youtaidudewamao/article/details/105028662

版权

本文介绍了提升算法的概念，它是通过每一步生成弱预测模型（如决策树）并加权累加来形成强模型。特别是讨论了梯度提升，它依据损失函数的梯度方向选择基函数，以逼近局部极小值。内容涵盖提升的理论意义、损失函数、以及梯度近似方法。

摘要由CSDN通过智能技术生成

关于提升

之前，关于随机森林的做法是：通过有放回的重采样生成出若干颗决策树 $\bigl(\begin{smallmatrix} \\ T_{1} \\ T_{2} \\ \cdot \cdot \cdot \\ T_{m} \end{smallmatrix}\bigr)$ ，从中取一个平均得到森林，这个randomforest实际是对这m颗树取平均得到的，它没有哪棵树更重要哪颗树不重要这种说法。

那么能不能换一种思路，给出这些树的权值，比如 $\bigl(\begin{smallmatrix} \\ {\alpha_{1} T_{1}} \\ {\alpha_{2}T_{2}} \\ \cdot \cdot \cdot \\ {\alpha_{m}T_{m}} \end{smallmatrix}\bigr)$ ，并不是简单的取平均而是加权，我们把这样一种方式叫做提升。用图来说明：