深度学习*学习笔记-----之决策树(1)

基本概念:训练集、测试集、特征集、监督学习、非监督学习、分类、回归
机器学习中分类和预测算法的评估:准确率、速度、强壮性、可规模性、可解释性
监督学习(supervised learning):训练集有类别标记(class label)
无监督学习(unsupervised learning):训练集无类别标记
半监督学习(supervised learning):有类型标记+无类别标记的训练集
1、什么是决策树(decision tree)?
判定树是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或者类分布。树的最顶层是根结点。
2、熵(entropy)
信息和抽象,如何度量?
信息量的度量就等于不确定性的大小

变量的不确定性越大,熵越大。
3、决策树归纳算法(ID3)
1870-1980,ID3算法
选择属性判断结点
信息获取量(Information Gain): Gain(A)=Info(D)-Infor_A(D)

算法:
(https://img-blog.csdn.net/20170406190424786?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvanV6aXNhbjM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
其他算法:C4.5、CART

树剪枝叶(overfitting)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值