怎么用clementine做关联规则分析

小伙伴们是不是还在为怎么做关联分析而苦恼呢?想自己写算法觉得太难,用软件分析又不会。不要怕,小迪来教了怎么用clementine做关联规则分析。

1、首先你得在你的电脑上安装clementine,安装方法我在另一篇博文上做出过说明。详情请见:http://blog.csdn.net/u014374031/article/details/50082941
这里再分享一个下载连接http://yunpan.cn/c3JuBpTTs8EtZ 访问密码 4619
2、先准备好要分析的数据。

这里写图片描述

虽然说明书上说clementine可以打开excel保存的以制表符分隔的文本文件,但是正真使用的时候就会报错。

这里写图片描述

这里写图片描述

现在我来教你们怎么正确输入数据。
先在excel中打开数据,然后按住左键选中全部数据(注意这里不要ctrl+A全选数据,这样不行。),Ctrl+C复制,新建一个文本文件,Ctrl+V粘贴,最后Ctrl+S保存。这样这个文件就可以被clementine识别。clementine导入数据的方法是在源下面选中可变文件,拖放到流图中,双击文件编辑它,在跳出对话框中选择刚才创建的文本文件。如图:

这里写图片描述

这里写图片描述

2、文件读取成功之后你可以添加一个表格输出,看看数据是否正确。
先在输出下面选择表,把它拖放到流图上。

这里写图片描述

右键点击可变文件选择连接把可变文件和表连接起来。
这里写图片描述

这里写图片描述

最后右击表选择执行,就可以看到数据了。简不简单,我觉得我说的像白痴一样,再不懂就不能怪我了。
这里写图片描述
这里写图片描述

3、上面数据都读取成功后就是对数据的类型进行分类。
选择“字段选项”下的类型,把它拖放到流图中,按照上面介绍的方法把可变的源文件和类型进行连接。

这里写图片描述

双击“类型”,一般如果是0/1或者T/F来标记一行记录中是否存在这种属性的时候,我们一般都选这类型为flat标记,就是两个圈圈的那个。如果某个列名下有多个属性,想我的数据中诊断就有很多不同的诊断,这种情况下就选择集合。其他的你们自己看着选。

方向的话,一般选择both就好了。

这里写图片描述

这里写图片描述

这里写图片描述

这样所有的类型就设置好了,进入下一步吧!

4、接下来的一步就是选择算法进行分析。clementine关于关联规则的算法有两种,一种是Apriori,一种是GRI。这里我们选择常用的Apriori算法。还是拖放“建模”选项下的Apriori到流图,将类型和Apriori连接起来。
这里写图片描述
双击Aprior编辑,在第一个选项“字段”里选择”使用定制设置”, 设置好规则的前项和后项。
这里写图片描述
然后在第二个选项里设置号最小支持度,最小置信度,以及最大前项数,
这里写图片描述

最后右击Apriori点击运行,在右边的框里双击”流“,就可以看到结果了。
这里写图片描述
这里写图片描述

  • 25
    点赞
  • 72
    收藏
    觉得还不错? 一键收藏
  • 21
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 21
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值