1、关联:(Association)
把两个或者两个以上在意义上,有密切联系的项组合在一起
关联规则(Association Rules AR)
用于从大量数据中挖掘出有价值的数据项之间的相关关系
协同过滤(Collaborative Filtering,简称CF)
协同过滤常常被用于分辨某位特定固定可能感兴趣的东西,这些结论来自于对其他相似顾客对哪些产品感兴趣的分析
2、关联规则(Association Rules)
两个不相交的非空集合X、Y,如果有X->Y,就说X->Y是一条关联规则
强度:支持度(support)、自信度(confidence)
效度:提升度(Lift)
3、挖掘定义
给定一个数据集,找出其中所有支持度support>=min_support、自信度
confidece>=min_confidece的关联规则
4、支持度的计算公式
suopport(X->Y)=集合X和集合Y中的项在一条记录中同时出现的次数/数据记录的个数
例如:
support({啤酒}->{尿布})
=啤酒和尿布同时出现的次数/记录数
=3/5=60%
5、自信度(Confidence)