决策树是二分树 信息论 单位为bit 5bit 决定世界冠军 5 = 1/32log1/32 信息熵越大 把减少不确定性的东西放在更头部的node 划分依据 信息增益 初始信息熵大小 -条件伤大小
不确定性减少最多 to_dict(orient)= record 通过调参增强精确度 sklearn可以可视化决策树 dot格式可以通过graphviz格式安装 转均jpg
决策树非常简单且可以可视化不需要数据处理 但是太容易出现过拟合 cart?随机森林 多个树 部分feature ensemble method = 集成学习