目录
1.决策树划分依据
信息增益
基尼系数(划分更仔细)
ID3:信息增益 最大的准则
C4.5:信息增益比 最大的准则
CART:
回归树: 平方误差 最小
分类树: 基尼系数 最小的准则 在sklearn中可以选择划分的原则
1.1.sklearn决策树API
1.2 数据
数据:http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt
1.3决策树结构本地保存
1.4 决策树案例 泰坦尼克号乘客生存分类
graphviz安装包以及原数据下载地址: