rapidminer进行关联分析、分类预测、聚类分析

商品交叉销售关联分析
Step1:检查数据缺失值、异常值
Step2:约减数据集中属性

在这里插入图片描述

Step3:FP-Growth找到频繁项集

在这里插入图片描述

Step4:产生关联规则

FF-Growth的min support = 0.9和create association rules min confidence = 0.9时的关联规则
在这里插入图片描述
但是结论conclusion都是Health Profucts Division,说明健康类商品是人们的生活必需品,参考价值不大。

我们适当放宽min support = 0.5和min confidence = 0.6
在这里插入图片描述
发现当Housewares Division,Novelty Gift Division存在时,Personal Electronics Division更容易被购买。support = 0.108

泰塔尼克号幸存者分类预测
step1:角色设定
step2:加入决策树操作符

在这里插入图片描述

step3:对测试数据集预测

在这里插入图片描述

step4:交叉检验

在这里插入图片描述
在这里插入图片描述
confidence = 0.5时的class precision = 76.52%和83.33%。
在这里插入图片描述
例如更改confidence = 0.1时,class precision = 75.07%和83.42%,相比之下confidence = 0.5的时候交叉检验效果更好一些。
在这里插入图片描述
调整决策树操作符的criterion参数,其中gain_ratio参数模型得到的效果明显好于gini_index参数。

gini_index参数
在这里插入图片描述
gain_ratio参数
在这里插入图片描述

Iris鸢尾花数据集聚类分析
step1:选择a1和a2属性
step2:添加K-means聚类操作符
step3:调整聚类个数,查看散点个数,人工评价聚类效果。

得到每个点的聚类结果
在这里插入图片描述
可视化表示聚类分析

此处选择的聚类个数是3,即k = 3
在这里插入图片描述
若选择聚类个数为5
在这里插入图片描述
聚类分析 k = 5
在这里插入图片描述

  • 6
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cachel wood

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值