随机森林是建立在决策树的基础上,决策树在分类时是选择所有变量,而随机森林则是产生很多决策树,然后每根决策树选择不同的变量,进行分析,最后选取决策树中的众数,作为最终结果
优点:不会产生过拟合现象
可以作用在高维数据中
能够展现出那些变量重要
具有很好的抗干扰能力
可以并行处理
缺点:可能有很多相似的决策树,掩盖了真实的结果
对小数据或者底维数据可能不能产生最好的分类
执行数据虽然比bossting等快,单比单只决策树慢多了
····
随机森林是建立在决策树的基础上,决策树在分类时是选择所有变量,而随机森林则是产生很多决策树,然后每根决策树选择不同的变量,进行分析,最后选取决策树中的众数,作为最终结果
优点:不会产生过拟合现象
可以作用在高维数据中
能够展现出那些变量重要
具有很好的抗干扰能力
可以并行处理
缺点:可能有很多相似的决策树,掩盖了真实的结果
对小数据或者底维数据可能不能产生最好的分类
执行数据虽然比bossting等快,单比单只决策树慢多了
····