第11章：使用Apriori算法进行关联分析（从频繁项集中挖掘关联规则）

最新推荐文章于 2024-07-14 09:10:52 发布

love_image_xie

最新推荐文章于 2024-07-14 09:10:52 发布

阅读量2.8k

点赞数

分类专栏：机器学习实战

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/love_image_xie/article/details/84666574

版权

本文介绍了使用Apriori算法进行关联分析的基本原理，通过频繁项集挖掘关联规则。例如，从购物数据中得出购买豆奶的顾客很可能也会购买莴苣。网络示意图展示了频繁项集{0,1,2,3}的关联规则，通过测试和合并规则，逐步发现高可信度的关联模式。此外，提供了相关代码实现。" 128753480,16808314,考研驿站APP开发：PHP+安卓源码详解与系统功能,"['PHP', '安卓开发', '考研资源', '数据库设计', '毕设项目']

摘要由CSDN通过智能技术生成

原理：

根据频繁项集找关联规则，如有一个频繁项集{豆奶，莴苣}，那么可能有一条关联规则是豆奶->莴苣，即一个人购买了豆奶，则大可能他会购买莴苣，但反过来一个人购买了莴苣，不一定他会购买豆奶，频繁项集使用支持度量化，关联规则使用可信度或置信度量化。一条规则P->H的可信度定义为支持度(P|H)/支持度(P)。（注意：python中'|'表示并集，数学中'U'表示并集）

网络示意图：

该图为频繁项集{0,1,2,3}的关联规则网络示意图，阴影区域是第可信度的规则，如果发现0,1,2->3是低可信度的，则以3为后件的规则可信度也会低。因此，先从一个频繁项集出发（单个元素是没有关联规则的，因此从两个元素的频繁项集出发），创建一个规则列表，该规则右边只包含一个元素，然后对这些规则测试；然后合并所有规则创建新的关联列表，该规则右边包含两个元素，以此类推。

代码：

def generateRules(L,supportData,minConf=0.5):

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

love_image_xie CSDN认证博客专家 CSDN认证企业博客

码龄8年

49: 原创

106万+: 周排名

63万+: 总排名

8万+: 访问

: 等级

1319: 积分

10: 粉丝

35: 获赞

12: 评论

226: 收藏

私信

关注

热门文章

分类专栏

最新评论

SeqGAN代码解析
IsAYN. . .: 同问，请问解决了吗？
SeqGAN代码解析
liudinglldd: self.pretrain_loss计算的是什么误差？如果用自己的数据文件替换target_lstm生成数据，那么这个pretrain_loss应该怎么改啊？现在只知道，计算pretrain_loss有两个量参加，一个是generator产生的eval_file通过likelihood_data_loader得到的batch，传递给self.x，参与计算的另一个量，self.g_prediction的计算过程如何用自己的数据文件来参与运算呢？
SeqGAN代码解析
liudinglldd: 试了，不对。替换文件之后，里面的值是一样的，多次运行发现里面的值始终是固定的，而且即使修改sequence length，维数也不会变化
SeqGAN代码解析
liudinglldd: 是不是把那个positive file替换成自己的文件就行了，同时修改那个sequence length？
opencv中Mat、Size、Point等出现的行列对应问题
递归黑: 我吐了，这那个nc设计的啊？

大家在看

《信息科技》计算思维之算法实现数据结构是关键

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。