【机器学习】第四章决策树练习题及答案

一. 单选题(共10题,66分)

1. 【单选题】以下关于决策树特点分析的说法错误的有 ( )。

A. 推理过程容易理解,计算简单

B. 算法容易造成过拟合

C. 算法自动忽略了对模型没有贡献的属性变量

D. 算法考虑了数据属性之间的相关性

正确答案: D

2. 【单选题】以下关于决策树原理介绍错误的有 ( )。

A. 决策树算法本质上是贪心算法

B. 决策树算法属于无监督学习

C. 决策树生成过程中需要用到分割法

D. 决策树决策过程从根节点开始

正确答案: B

3. 【单选题】我们想要在大数据集上训练决策树模型,为了使用较少的时间,可以:( )。

A. 增大学习率

B. 减少树的数量

C. 减少树的深度

D. 增加树的深度

正确答案: C

4. 【单选题】以下关于决策树算法说法错误的是 ( )。

A. C4.5算法不能用于处理不完整数据

B. C4.5算法选择信息增益率来选择属性

C. CART算法选择基尼系数来选择属性

D. ID3算法选择信息增益最大的特征作为当前决策节点

正确答案: A

5. 【单选题】C4.5选择属性用的是( )。

A. 信息增益率

B. 交叉熵

C. 信息熵

D. 信息增益

正确答案: A

6. 【单选题】以下那种说法是错误的( )。

A. 一个系统越是有序,信息熵就越低

B. 中国足球队战胜巴西足球队的信息熵要小于中国乒乓球队战胜巴西乒乓球队的信息熵

C. 信息增益 = 信息熵 - 条件熵

D. 一个系统越是混乱,随机变量的不确定性就越大,信息熵就越高

正确答案: B

7. 【单选题】‏ID3 算法的缺点不包括( )。

A. 没有考虑缺失值

B. 信息增益准则对可取值数目较多的特征有所偏好,类似“编号”的特征其信息增益接近于 1

C. ID3 没有剪枝策略,容易过拟合

D. 既能用于处理离散分布的特征,也能用于连续分布的特征处理

正确答案: D

8. 【单选题】关于CART算法,错误的是( )。

A. CART算法既可以处理分类问题,也可以处理回归问题

B. 可以处理样本不平衡问题

C. CART算法采用信息增益率的大小来度量特征的各个划分点

D. CART 分类树采用基尼系数的大小来度量特征的各个划分点

正确答案: C

9. 【单选题】关于C4.5算法,错误的是( )。

A. C4.5算法采用基尼系数的大小来度量特征的各个划分点

B. C4.5算法引入悲观剪枝策略进行后剪枝

C. C4.5算法可以处理非离散的数据

D. C4.5 算法最大的特点是克服了 ID3 对特征数目的偏重这一缺点

正确答案: A

10. 【单选题】ID3选择属性用的是( )。

A. 信息增益率

B. 信息增益

C. 信息熵

D. 交叉熵

正确答案: B

二. 多选题(共2题,13.2分)

11. 【多选题】决策树的说法正确的是( )。

A. CART使用的是二叉树

B. 其可作为分类算法,也可用于回归模型

C. 不能处理连续型特征

D. 它易于理解、可解释性强

正确答案: ABD

12. 【多选题】决策树有哪些代表算法 ( )。

A. ID3

B. C4.5

C. CART

D. CNN

正确答案: ABC

三. 判断题(共3题,20.8分)

13. (判断题) ID3算法的核心思想就是以信息增益来度量特征选择,选择信息增益最大的特征进行分裂。

A. 对

B. 错

正确答案: 对

14. (判断题)决策树的生成只考虑局部最优,相对地,决策树的剪枝则考虑全部最优。

A. 对

B. 错

正确答案: 对

15. (判断题) ‌ID3和C4.5和CART都只能用于分类问题,不能用于回归问题。

A. 对

B. 错

正确答案: 错

  • 4
    点赞
  • 61
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值