《机器学习实战》学习笔记（十）之使用Apriori算法进行关联

最新推荐文章于 2022-12-01 19:54:23 发布

john_bh

最新推荐文章于 2022-12-01 19:54:23 发布

阅读量761

点赞数

分类专栏：机器学习实战文章标签： Apriori算法机器学习实战

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/john_bh/article/details/79199476

版权

机器学习实战专栏收录该内容

20 篇文章 5 订阅

订阅专栏

转载请注明作者和出处：http://blog.csdn.net/john_bh/
运行平台： Windows
Python版本： Python3.6
IDE： Sublime text3

背景
一关联分析
二Apriori原理
三使用Apriori算法来发现频繁集
- 1 生成候选项集
- 2 组织完整的Apriori算法
四从频繁项集中挖掘关联规则
五实例发现国会投票的模式
六实例2发现毒蘑菇的相似特征
总结

背景

一、关联分析

二、Apriori原理

三、使用Apriori算法来发现频繁集

3.1 生成候选项集

3.2 组织完整的Apriori算法

四、从频繁项集中挖掘关联规则

五、实例：发现国会投票的模式

六、实例2：发现毒蘑菇的相似特征

总结

关联分析适用于发现大数据集中元素间有趣关系的一个工具集。可以采用两种方式来量化这些有趣的关系。
第一种是使用频繁项集，它会给出经常出现在一起的元素项。
第二种方式是关联规则，每条关联规则意味着元素项之间的“如果…….那么…..”关系。

发现元素项间不同的组合是个十分耗时的任务，不可避免需要大量昂贵的计算资源，这就需要一些更智能的放法在合理的时间范围内找到频繁项集。能够实现这一目标的一个方法是Ariori算法，它使用Apriori原理来减少在数据库上进行检查的集合的数目。**Apriori原理是说如果一个元素项不是频繁的，那么那些包含该元素的超集也不是频繁的。**Apriori算法从单元素项集开始，通过组合满足最小支持度要求的项集来形成更大的集合。支持度用来度量一个集合在原始数据中出现的频率。

关联分析可以用在许多不同物品上。商店中的商品以及网站的访问页面是其中比较常见的例子。关联分析也曾用于查看选举人及法官的投票历史。

每次增加频繁项集的大小，Apriori算法都会从新扫描整个数据集，当数据很大时，这会显著降低频繁项集发现的速度。于是我们可以使用PF-growth算法，和Apriori算法相比，该算法只需要对数据库进行两次遍历，所以能够显著提高发现频繁项集的速度。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《机器学习实战》学习笔记（十）之使用Apriori算法进行关联

转载请注明作者和出处：http://blog.csdn.net/john_bh/ 运行平台： Windows Python版本： Python3.6 IDE： Sublime text3背景一关联分析二Apriori原理三使用Apriori算法来发现频繁集1 生成候选项集2 组织完整的Apriori算法四从频繁项集中挖掘关联规则五实例发现国会投票的模式六实例
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。