决策树模型 IBM SPSS Modeler 18.0

(该文为个人的一个记录,也许有错,可以参考下)

决策树模型建立

1.点击源、Excel,在空白处得到一个Excel

点击生成的Excel,导入要处理的数据,再点确定

 PS:点击上图中的预览可以查看表格数据

 2.点击字段选项、类型,在空白得到一个类型图标

 点生成的类型图标,点选取值,选择输入的数据和要预测的目标(目标测量要为分类,不能是连续),最后点确定即可。

3.点击 分区,在空白处得到分区图标

 点生成的分区图标,一般训练、测试分区设为70:30,之后可以根据所需调整比例,最后点确定

 4.点 建模、C 5.0,

 点得到的 C 5.0,点击 运行,得到结果

 

5.点击 结果,得到下图

 

 预测变量重要性图

(个人感觉就是一些变量对目标的重要性,重要性越大,对目标影响越大)

决策树模型

(点击那个按钮可以复制这个模型) 

(那个按钮右边为放大、缩小按钮,再右边三个按钮为展现数据的形式,再右边三个按钮为展现 竖立、右横着、左横着 的模型形式,可以自己试试,描述不是很清楚)

6.点 输出、分析

 点击 分析,勾选你想要的数据(我举例子就不勾选数据了,直接默认输出),再点 运行,得到结果如下下图

 

 

 

(这个结果说明 训练集预测正确率、错误率为65.31%、34.69%,预测集预测正确率、错误率为53.1%、46.9%)

(预测集正确性越高,模型准确率越高,80%以上好些)

(要提高模型准确率,可以调整训练集测试集比例、调整输入的数据)

7.结果分析(可以参考下)

比如:评估度量

 

 (1)AUC值

AUC值一般在[0.5,1]中,0.5代表模型没有分类效果,小于0.5表示不如随机预测,大于0.5表示得到的模型比随机猜测好,AUC值越高越好。此外,AUC比准确率在对数据不平衡的数据集构建的模型有更好的评价意义。

(2)Gnini(基尼指数)

基尼指数表示在样本集合中一个随机选中的样本被分错的概率。Gini越小,表示集合中被选错的样本被参错的概率越小,也可以说是集合的纯度越高,特征越好,反之则纯度不高。

  • 7
    点赞
  • 69
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值