算法进阶 文章目录 算法进阶 决策树学习算法: 决策树的过拟合 复习信息熵,联合熵,条件熵,互信息 决策树学习算法: 信息增益 ID3,C4.5,CART Bagging与随机森林 CART:输入数据X:M个样本数据,每个数据包括年龄、性别、职业,每日使用计算时间等;输出数据:该样本是否喜欢计算机 决策树:莺尾花决策树=特征选择结果 条件熵H(x,y)-H(x),(x,y)发生所包含的熵,减去X单独发生包含的熵,在X发生的前提下,Y发生新带来的熵,该式子定义为X发生前提下,Y的熵:条件熵H(Y|X)