Random Forests
随机森林或随机决策森林是用于分类,回归和其他任务的集成学习方法,其通过在训练时构建多个决策树并输出作为类的模式(分类)或平均预测(回归)的类来操作。个别树木。随机决策森林纠正决策树过度拟合其训练集的习惯。
随机决策森林的第一个算法是由Tin Kam Ho 使用随机子空间方法创建的,在Tin Kam Ho的公式中,这是一种实现Eugene Kleinberg提出的“随机区分”分类方法的方法。
- Decision Trees in a Nutshell
决策树是一种机器学习算法,能够拟合复杂的数据集并执行分类和回归任务。树后面的想法是在训练集内搜索一对变量值,并将其分割为生成“最佳”两个子子集的方式。目标是基于最佳分裂标准创建分支和叶子,这个过程称为树生长。具体地,在每个分支或节点处,条件语句基于特定变量中的固定阈值对数据点进行分类,从而分割数据。为了进行预测,每个新实例都在根节点(树的顶部)开始,并沿着分支移动,直到它到达叶节点,在那里不可能进一步分支。
用于训练树的算法称为CART(®)(分类和回归树)。正如我们已经提到的&