spss 关联关系挖掘算法

本文介绍了几种常用的关联规则挖掘技术,包括广义规则归纳(GRI)、Apriori及序列节点等。这些技术能帮助我们从大数据集中发现有价值的关联规律,并应用于推荐系统等领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

广义规则归纳(GRI) 节点会发现数据中的关联规则。例如,购买了剔须刀和客户在购买须后水之后,还可能会购买剔须霜。GRI 基于某项指数抽取了信息量最大的规则,此指数考虑了规则的普遍性(支持度)和准确性(置信度)。GRI 可以处理数值型和分类型输入,但目标必须是分类型。

Apriori 节点从数据抽取一组规则,即抽取信息内容最多的规则。Apriori 节点提供五种选择规则的方法并使用复杂的索引模式来高效地处理大数据集。对于大问题而言,Apriori 通常用于训练时比GRI 处理速度快;它对可保留的规则数量没有任何限制,而且可处理最多带有32 个前提条件的规则。Apriori 要求输入和输出字段均为分类型字段,但因为它专为处理此类型数据而进行优化,因而处理速度快得多。

序列节点可发现连续数据或与时间有关的数据中的关联规则。一个序列指趋向于以可预测的顺序发生的项目集合的列表。例如,一个购买了剃刀和须后水的顾客可能在下次购物时购买剃须膏。序列节点基于CARMA 关联规则算法,该算法使用有效的两步法来发现序列。

交易数据格式:
消费者 购买商品
1 果酱
2 牛奶
3 果酱
3 面包
4 果酱
4 面包
4 牛奶
Apriori、CARMA 和序列节点都可使用交易数据。GRI不支持

表格数据格式:
消费者 果酱 面包 牛奶
1 T F F
2 F F T
3 T T F
4 T T T
Apriori、CARMA、GRI 和序列节点都可使用表格数据。

GRI 节点还可以处理多个输出字段。与Apriori 不同,GRI 可以处理数字输入字段也可以处理符号输入字段
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值