Apriori算法进行数据关联分析

最新推荐文章于 2024-05-26 18:53:36 发布

lzhalan2016

最新推荐文章于 2024-05-26 18:53:36 发布

阅读量5.9k

点赞数 2

分类专栏：机器学习文章标签：机器学习数据挖掘关联分析 apriori 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lzhalan2016/article/details/51926576

版权

从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联规则学习。这里的主要问题在于，寻找物品的不同组合是一项十分耗时的任务，所需的计算代价很高，蛮力搜索方法并不能解决这个问题，所以需要用更智能的方法在合理的时间范围内找到频繁项集。

为了快速明确概念，从例子出发，现在面对一沓超市购物单，我们要从中分析出哪些物品与哪些物品的关联度特别高，换句话说，当顾客买了商品A后，有多大的几率会购买B商品。通过关联分析可以帮助超市摆放不同商品之间就有了隐形的规则，比如葡萄酒旁边摆着尿布明显提升了两者的销量。

a.解释几个概念

1、数据对象：

假如对超市购物单进行分析，用0，1，2，3代替一种物品，列表如[[1,2],[1,3,0],[0,1],[0,2],[1,2,3,0]]就是一组由5个购物单组成的数据对象，其中每个子列表代替一个购物单（如[1,2]），目标就是分析通过以上的数据分析每种物品的关联关系。

2、支持度定义

支持度是衡量某个物品或物品组合是否频繁的有效指标，计算公式为

支持度=该物品或物品组合出现次数/总购物单数

最低0.47元/天解锁文章

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
Apriori算法进行数据关联分析

从大规模数据集中寻找物品间的隐含关系被称作关联分析（association analysis）或者关联规则学习（association rule learning）。这里的主要问题在于，寻找物品的不同组合是一项十分耗时的任务，所需的计算代价很高，蛮力搜索方法并不能解决这个问题，所以需要用更智能的方法在合理的时间范围内找到频繁项集。为了快速明确概念，从例子出发，现在面对一沓超市购
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。