步骤如下:
1. 去掉不满足最小支持度的元素项
2. 对事务记录过滤和排序,构建FP树
排序基于元素项的绝对出现频率来进行;
构建FP树的过程:
从空集开始,向其中不断加频繁项集。过滤、排序后的事务依次添加到树中,如果树中已存在现有元素,
则增加现有元素的值;如果现有元素不存在,则向树添加一个分枝。
3. 抽取条件模式基
首先从保存在头指针表中的单个频繁元素项开始,对于每一个元素项,获得其对应的条件模式基。
条件模式基是以所查找元素项为结尾的路径集合。每一条路径其实都是一条前缀路径。简而言之,一条前缀
路径是介于所查找元素项与树根节点之间的所有内容。
4. 创建FP条件树
对于每一个频繁项,都要创建一棵条件FP树。有些元素项单独看来它们都是频繁项,但是在条件树中,它们却不是频繁的。