关联规则
千语_肉丸子
好好学习、天天向上
结交各种大牛、共同进步
展开
-
关联规则算法2-----关联规则FP-Growth
1 FP-Growth算法背景 常见的关联规则算法分为两类,一:Apriori算法,二:FPGrowth。 Apriori:不断扫描数据库、构造候选集、筛选候选集,挖掘出频繁项集,,缺点:当数据量较大时,运行速度较慢。 FPGrowth算法优势:只需扫描两遍数据,通过FP-tree数据结构压缩原始数据,效率较高。FPGrowth算法主要分为两个步骤:FP-tree构建、递归挖掘FP-tree...原创 2017-03-20 12:46:57 · 2638 阅读 · 0 评论 -
关联规则算法1------关联规则Apriori原理和R实现
1 关联规则产生 关联规则反应的是一个事物与其他事物之间的关联关系,被称为购物篮模型,最初产生为啤酒喝尿布的故事。电商网站多用于商品推荐、联合发券、品类联合促销等方面。 2 关联规则指标 1)支持度为事物在数据集中发生的概率,支持度的意义在于度量项集在整个事务集中出现的频次,我们希望关注频次高的项集。 Support(A)=A/U 2)置信度,在A发生的条件下B发生的概率 Confid...原创 2017-03-14 21:29:47 · 1319 阅读 · 0 评论