定义
Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过频繁项集生成和关联规则生成两个阶段来挖掘频繁项集。它的主要任务就是设法发现事物之间的内在联系。
比如在常见的超市购物数据集,或者电商的网购数据集中,如果我们找到了频繁出现的数据集,那么对于超市,我们可以优化产品的位置摆放,对于电商,我们可以优化商品所在的仓库位置,达到节约成本,增加经济效益的目的。
算法已经被广泛的应用到商业、网络安全,移动通信等各个领域。
关联 | 两个或多个变量取值之间存在一类重要的可被发现的某种规律 |
---|---|
关联分析 | 寻找给定数据记录数据集中数据项之间隐藏的关联关系,描述数据之间的密切度 |
项集 | 项的集合,包含k各项的项集成为k项集 |
事务 | 一个项集就是一个事务 |
事务宽度 | 事务中出现的项的个数 |
支持度 | 𝑠𝑢𝑝𝑝𝑜𝑟𝑡(𝑋→𝑌) =/𝑋交𝑌//𝑁,表示物品集X和Y同时出现的次数占总记录数的比例。 |
置信度 | 𝑐𝑜𝑛𝑓𝑖𝑑ᵅ |