1 传统关联规则挖掘
1.1 简介
-
目标: 发现事务数据库不同项之间的联系, 这些联系构成的规则, 可以帮助找到某些行为特征,帮忙决策
-
场景: 超市, 网络浏览偏好, 入侵检测, 生产等领域
-
与序列挖掘的不同:
- 不考虑事务内,或者事件之间的先后顺序
- 只考虑前件,后件
- 不相交的项集
1.1.1 相关的概念
-
全局项I: I={ i 1 , i 2 , . . . , i j , . . . , i m i_{1},i_{2},...,i_{j},...,i_{m} i1,i2,...,ij,...,im}
-
事务数据库T: T={ t 1 , t 2 , . . . , t i , . . . , t n t_{1},t_{2},...,t_{i},...,t_{n} t1,t2,...,ti,...,tn}
-
项集: 非空不重复 例如 I 1 = i 1 , i 2 , i 3 I_{1}={i_{1},i_{2},i_{3}} I1