spss 关联关系挖掘算法

最新推荐文章于 2023-05-31 14:18:42 发布

iteye_10344

最新推荐文章于 2023-05-31 14:18:42 发布

阅读量1.4k

点赞数

分类专栏：数据挖掘文章标签：大数据

本文链接：https://blog.csdn.net/iteye_10344/article/details/82231838

版权

数据挖掘专栏收录该内容

11 篇文章

订阅专栏

本文介绍了几种常用的关联规则挖掘技术，包括广义规则归纳(GRI)、Apriori及序列节点等。这些技术能帮助我们从大数据集中发现有价值的关联规律，并应用于推荐系统等领域。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

广义规则归纳(GRI) 节点会发现数据中的关联规则。例如，购买了剔须刀和客户在购买须后水之后，还可能会购买剔须霜。GRI 基于某项指数抽取了信息量最大的规则，此指数考虑了规则的普遍性（支持度）和准确性（置信度）。GRI 可以处理数值型和分类型输入，但目标必须是分类型。

Apriori 节点从数据抽取一组规则，即抽取信息内容最多的规则。Apriori 节点提供五种选择规则的方法并使用复杂的索引模式来高效地处理大数据集。对于大问题而言，Apriori 通常用于训练时比GRI 处理速度快；它对可保留的规则数量没有任何限制，而且可处理最多带有32 个前提条件的规则。Apriori 要求输入和输出字段均为分类型字段，但因为它专为处理此类型数据而进行优化，因而处理速度快得多。

序列节点可发现连续数据或与时间有关的数据中的关联规则。一个序列指趋向于以可预测的顺序发生的项目集合的列表。例如，一个购买了剃刀和须后水的顾客可能在下次购物时购买剃须膏。序列节点基于CARMA 关联规则算法，该算法使用有效的两步法来发现序列。

交易数据格式：
消费者购买商品
1 果酱
2 牛奶
3 果酱
3 面包
4 果酱
4 面包
4 牛奶
Apriori、CARMA 和序列节点都可使用交易数据。GRI不支持

表格数据格式：
消费者果酱面包牛奶
1 T F F
2 F F T
3 T T F
4 T T T
Apriori、CARMA、GRI 和序列节点都可使用表格数据。

GRI 节点还可以处理多个输出字段。与Apriori 不同，GRI 可以处理数字输入字段也可以处理符号输入字段