【机器学习基础】Apriori算法

最新推荐文章于 2023-10-17 20:02:43 发布

Tuzi_bo

最新推荐文章于 2023-10-17 20:02:43 发布

阅读量543

点赞数 1

分类专栏：机器学习文章标签：机器学习 Apriori

本文链接：https://blog.csdn.net/u010834867/article/details/89532004

版权

Apriori算法是一种关联规则挖掘方法，用于找出数据集中的频繁项集和关联规则。本文介绍了关联规则的基本概念，如支持度和置信度，并详细阐述了Apriori算法的工作原理和Python实现，包括构造数据集、生成候选集、计算支持度以及生成关联规则的过程。

摘要由CSDN通过智能技术生成

1 关联规则简介

2 相关定义

3 Apriori简介

4 Apriori代码功能详解(Python3)

1 关联规则简介

关联规则分析也称为购物篮分析，最早是为了发现超市销售数据库中的不同商品之间的关联关系。关联规则反映的是一个事物与其他事物之间的关联性，如果多个事物之前存在着某种关联关系，那么其中的一个事物就可以通过其他事物预测到。

比较经典的一个案例就是啤酒与尿布的例子，20世纪90年代，美国沃尔玛超市的管理人员在分析销售数据时，发现了一个令人难以理解的现象：在某些特定的情况下，“啤酒”与“尿布”这两个看上去毫无关联的物品，经常会出现在同一个购物篮中，且大多数出现在年轻的父亲身上。分析背后的原因之后才发现，在美国有婴儿的家庭中，一般都是母亲在家照顾婴儿，父亲出门购买尿布，而这个时候父亲会给自己买一份啤酒。如果把这两个物品放在同一个区域进行销售，就很有可能会增加营业额。

这个故事就已经告诉我们，各个行业的运营其实都离不开对数据的分析。本文的Apriori算法就是通过对数据进行挖掘，找出其中的频繁项集和关联规则。