https://blog.csdn.net/weixin_49272172/article/details/115261791
作业解析参考
决策树的有监督体现在分类过程,选择特征属性的过程,每一次都选择信息增益最大的属性开进行分类。属性它有特定的实际值。
决策树的定义,确定好X和Y,Y就是叶子节点的值,X的特征属性就在中间的节点
决策树最基本的三个流程
决策树三个最基本的算法
信息增益的定义
信息增益计算
某个属性来划分,就是根据属性的实际值来划分。
预剪枝
后剪枝
还可以根据树的最大深度,或者节点的叶子节点个数这些超参数来限制树的复杂度
随机森林,可以通过模型集成的方式来减小误差,本质上就是减少偏差
数据集的特征维度大小,是随着树的深度划分逐渐递减的!