一句话
你不知道用什么模型的时候就用RF。
优点
- 万金油。只要是分类,回归问题,都能一股脑的用它。
- 操作简单。不可否认神经网络的效果比它好,但是神经网络要疯狂调参啊,一调就是好几天,你见过像RF这么乖巧,耐操,就几个参数就搞定的么。
- 效果好。因为本质上是用了很多不同模型的Tree。总有一些树蒙对,所以不管是什么问题,运行出来的效果不会太差。
缺点
- 内存消耗高。种几百颗树,没有十几亩“地”不行。
- 容易过拟合。
- 过程黑箱。操作简单的副作用就是控制的参数太少,调整的余地不大,过程完全黑箱。
你不知道用什么模型的时候就用RF。