关联规则、频繁项集、支持度、置信度
关联规则挖掘:
一起购买的商品
支持度(support)
支持度会随着物品增多而减小。因为是同时购买的比率。
置信度(Confidence)
频繁且强规则,有一定意义。
Apriori算法
太复杂。
先寻找频繁项集(大于所设置阈值),这时剔除掉不频繁的了。
构建下一个候选项集,再次寻找频繁项集L2(图中字打错了)
优缺点
解决:数据表压缩/快速查找特性进行项集的选择/抽取部分数据代表整体
关联规则挖掘:
一起购买的商品
支持度会随着物品增多而减小。因为是同时购买的比率。
频繁且强规则,有一定意义。
太复杂。
先寻找频繁项集(大于所设置阈值),这时剔除掉不频繁的了。
构建下一个候选项集,再次寻找频繁项集L2(图中字打错了)
解决:数据表压缩/快速查找特性进行项集的选择/抽取部分数据代表整体
转载于:https://www.cnblogs.com/wxl845235800/p/10187355.html