第四章 决策树(代码待补)

在这里插入图片描述

4.1

决策树停止生成的三个条件:
1.当前结点包含的样本全属于同一类别,无需划分
2.当前属性集为空,或是所有样本在所有属性上取值相同,无法划分
3.当前结点包含的样本集合为空,不能划分
而题目中特征向量完全相同但标记不同的,就属于第二种情况里的所有样本在所有属性上取值相同,无法划分,这时候会将样本数最多的类返回,以后训练数据用此决策树预测时都返回同一个类,因此若要保证训练误差为0,那么一定不能存在特征向量完全相同但类不同的数据,即不能存在冲突数据。(因为在用训练数据做测试时,特征向量相同一定会被归到一个类里,但是实际中他们特征向量相同,但类不同,这样就有了误差)

4.2

训练样本是有限的,并不能代表整个样本空间,因此单纯的使用最小训练误差只是对这个训练集数据效果不错,但是对整个样本空间的数据来讲是极其容易引起过拟合的。因为决策树里挑选划分特征是为了挑出对分类影响大的特征,但训练误差这个有很强的偶然性,不能代表一般规律。

4.3

4.4

4.5

4.6

4.7

4.8

4.9

在这里插入图片描述

4.10

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值