一、决策树前置知识准备
1.1 信息熵
信息熵也叫香农熵,其计算公式为:
1.2 条件熵
在给定X的条件下,所有的不同x值的条件下Y的熵的平均值叫做条件熵。
计算公式为:
1.3 纯度度量的公式(值越大越不纯)
1)信息熵
2)基尼系数
3)错误率
二、决策树
sklearn.tree.
DecisionTreeClassifier
(criterion=’gini’<