为什么决策树需要剪枝?我们可以类比于神经网络的“过拟合”问题来进行思考。在神经网络之中,会出现过拟合问题,即出思安对特定的样本识别率升高,对其余样本的识别率降低。在决策树中也会出现类似的问题,会出现枝条过多的现象,是问题复杂化,准确率却得不到上升。
决策树的剪枝分为2种,一种是预剪枝,第二种是后剪枝。
预剪枝:在创建进行到某一个节点处,我们先计算当前节点的准确率,然后在按照该节点的属性进行分类,在计算分类后的准确率,比较和,如果较大则该节点不需要进一步的分枝,否则如果
为什么决策树需要剪枝?我们可以类比于神经网络的“过拟合”问题来进行思考。在神经网络之中,会出现过拟合问题,即出思安对特定的样本识别率升高,对其余样本的识别率降低。在决策树中也会出现类似的问题,会出现枝条过多的现象,是问题复杂化,准确率却得不到上升。
决策树的剪枝分为2种,一种是预剪枝,第二种是后剪枝。
预剪枝:在创建进行到某一个节点处,我们先计算当前节点的准确率,然后在按照该节点的属性进行分类,在计算分类后的准确率,比较和,如果较大则该节点不需要进一步的分枝,否则如果