1.Apriori算法简介
Apriori算法是常用于挖掘出数据关联规则的算法,能够发现事物数据库中频繁出现的数据集,这些联系构成的规则可帮助用户找出某些行为特征,以便进行企业决策。例如,某食品商店希望发现顾客的购买行为,通过购物篮分析得到大部分顾客会在一次购物中同时购买面包和牛奶,那么该商店便可以通过降价促销面包的同时提高面包和牛奶的销量。了解Apriori算法推导之前,我们先介绍一些基本概念。
- **事务数据库:**设 I = { i 1 , i 2 , … , i m } I=\{ i_1,i_2,…,i_m \} I={ i1,i2,…,im}是一个全局项的集合,事物数据库 D = { t 1 , t 2 , . . , t n } D=\{ t_1,t_2,..,t_n \} D={ t1,t2,..,tn}是一个事务的集合,每个事务 t i ( 1 ≤ i ≤ n ) t_i(1\le i \le n) t