我对机器学习模型的学习方法分为三点:学会如何使用(how),扫盲式的了解它是个什么东西(What),以及什么时候使用(when)。
定义
RF是用来处于 分类 问题和 回归 问题的通用性模型,属于 集成学习(Ensemble) 的一种。(什么是集成学习?画上问号,后几篇文章解释)
关键词
森林
我知道你想的是这样:
没错就是这样,所以核心就是每棵树:
- 是什么:不同模型的决策树 (Decision Tree)(这是什么?以后解释,不影响现在理解。)
- 有什么用:每棵树都从训练总体样本M中随机抽取m个样本进行决策,得到决策结果。
随机
每科树都是从训练总体样本M中随机抽取m个样本。
结果处理
由于每棵树所用模型都不同,所以树们的结果有好有坏,如何得到我想要的好结果?
方法就是:投票。
将所有决策树的结果进行投票(别问我怎么是进行投票的),反正最后得到我想要的结果。