作者:非妃是公主
专栏:《机器学习》
个性签:顺境不惰,逆境不馁,以心制境,万事可成。——曾国藩
专栏地址
专栏系列文章
决策树学习基本知识
决策树学习基本算法
上面是一个递归调用的过程
决策树学习常见问题
最佳划分的度量问题
选择能使熵最大减小的属性
结合图像理解三个指数
熵x ∈ \in ∈[0, 1]:
基尼指数x ∈ \in ∈[0, 1]:
做一条辅助线就会发现:越靠近中间,红色的线越长,说明我们熵是越大的
误分类率x ∈ \in ∈[0, 1]:
C4.5决策树算法
从图像可以理解:属性分布越均匀,SplitInfo越大
加上下面六种统计信息增益度量的方法,一共存在9种
堂兄弟姐妹类型可以不同
处理确实属性值问题
处理连续属性值问题
离散化
叶子结点判定问题
怎样解决过拟合问题
待测样本分类问题
决策树学习理解解释
决策树表达为析取表达式(可解释性):