决策树

如何构建决策树

  1. 准备工作:
    1. 明确自变量和因变量
    2. 确定信息度量的方式
    3. 确定终止条件
  2. 选择特征
    1. 得到当前待处理子集
    2. 计算所有特征信息度量
    3. 得到当前最佳分类特征
  3. 创建分支
    • 根据选中特征将当前记录分成不同分支,分支个数取决于算法
  4. 是否终止
    • 判断是否满足终止条件
  5. 生成结果
    • 判断是否需要剪枝

案例

根据部分电脑购买记录,对购买者建模。该模型可以基于客户的一些信息预测他是否会购买电脑。

记录标识人群群体收入层次是否单身信用等级是否购买电脑
1青年一般
2青年良好
3中年一般
4老年一般
5老年一般
6老年良好
7中年良好
8青年一般
9青年一般
10老年一般
11青年良好
12中年良好
13中年一般
14老年良好
准备工作
  1. 观察数据,明确自变量和因变量
    • 自变量:人群群体、收入层次、是否单身、信用等级
    • 因变量:是否购买电脑
  2. 明确信息度量方式:信息增益
    • 基尼系数
  3. 明确分支终止条件
    • 纯度
    • 记录条数
    • 循环次数



  构建一棵决策树
1531067-20190221153039897-1061029007.png

1531067-20190221153129426-991555641.png

1531067-20190221153205075-330325940.png
观察各自的分支,再根据情况选择是否还需要再次挑选特征进行区分,最终的结果如下。
1531067-20190221153221318-896523015.png

各类决策树算法的对比

1531067-20190221153326400-506727661.png

转载于:https://www.cnblogs.com/shayue/p/10412914.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值