7.1 处理分类属性
二元化分类属性
7.2 处理连续属性
包含连续属性的关联规则通常称为量化关联规则
7.2.1 基于离散化的方法
将连续属性的邻近值分组,形成有限个区间。
如何确定区间宽度:考虑临近区间的每种可能分组。
7.2.2 基于统计学的方法
1.规则产生:频繁项集
2.规则确认:当由规则覆盖的事务计算的统计量不同于未被规则覆盖的事务计算的统计量
7.2.3 非离散化方法
min-Aprior
7.3 处理概念分层
7.4 序列模式
7.4.1 问题描述
序列;元素;事件;子序列;
7.4.2 序列模式发现
7.4.3 时限约束
1.最大跨度约束
maxspan=3:
2.最小间隔和最大间隔约束
maxgap=3,mingap=1:
3.窗口大小约束
ws=2:
7.4.4 可选计数方案
序列数据的支持度计数方法