频繁模式是频繁地出现在数据集中的模式,包括频繁项集(如牛奶和面包)、频繁子序列(首先购买PC,然后是数码相机,再后是内存卡)或频繁子结构(涉及不同的结构形式,如子图、子树或子格,它可能与项集或子序列结合在一起)。从大量的商务事物记录中发现有趣相关联系,可为分类设计、交叉销售和购物购买习惯分析等许多商务决策过程提供帮助。
频繁项集挖掘,如购物篮分析等,这些模式可用关联规则的形式表示。
关联规则的支持度为2%,意味所分析的所有事务的2%显示计算机和杀毒软件被同时购买。置信度60%意味购买计算机的顾客60%也购买了杀毒软件。
项的集合称为项集。包含k个项的项集称为k项集。项集的出现频度是包含项集的事务数,称为项集的频度、支持度计数或计数。