- 博客(2)
- 收藏
- 关注
原创 随机森林分类、回归、调参、特征重要性
训练模型,设置25棵树,计算袋外误差。解释一下袋外数据的概念:有放回抽样,每个样本被抽到的概率是1/n,所以不被抽到的概率是1-1/n,所以n个样本都不被抽到的概率就是:(1-1/n)^n,用洛必达法则化简,这个概率收敛到1/e,约等于0.37。正常来说,只要特征值不要设置的太小,所有特征都会被整个森林抽取到用来训练,所以相对来说这个值对整个模型的影响不是太大,但是这个值越大,单棵树需要考虑的特征越多,虽然模型的表现可能会更好,但是增加这个值对导致算法运行速度变慢,所以我们需要考虑去找一个平衡值。
2024-01-09 09:03:30 3749 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人