智能技术_1:安装TensorFlow和Keras
智能技术_2:大数据分析与机器学习概论
智能技术_3:关联规则
智能技术_4:贝叶斯分类和贝叶斯网络
智能技术_5:决策树
智能技术(串讲)
https://www.bilibili.com/video/BV11X4y1g7Hx?p=1
# 写于2021.04.09
# 本文为学习笔记,用的ppt是陈志华教授的
# 笔记只为交流,侵删
# 总结不易 望赞鼓励
1 决策树
决策树具有监督式的特征萃取与描述的功能,将输入数据属性根据目标设定来选择分支资料属性和分支方式,并以树枝状的层级架构呈现,以萃取分类规则。经过修整后的决策树模型可以作为资料探索或预测。决策树可以找出目标属性和各个数据属性的层级关系。
我的理解就是决策树是来选择当前对结果影响最大的属性的。
那么我们目标预测购买不购买不动产,应该关注婚姻属性还是收入属性?可以用决策树判断。
2. 信息增益(Information Gain)为基础的决策树
2.1 ID3
方法:①算出目标属性的信息乱度;②算出不同条件下,目标属性的概率③用公式算出目标属性乱度和有条件下的目标属性乱度差值。
结论:差值越大,信息越多,属性越重要
2.1.1 公式
2.1.2 ID3之案例3
①算出目标属性的信息乱度:
②算出不同条件下,目标属性的概率: