数据挖掘之FP-Tree算法速学详解

最新推荐文章于 2021-01-30 11:41:04 发布

大吱佬

最新推荐文章于 2021-01-30 11:41:04 发布

阅读量9.3k

点赞数 19

文章标签：算法

本文链接：https://blog.csdn.net/weixin_43752106/article/details/112331756

版权

Frequent Pattern Tree：进行2次数据库扫描：一次对所有1-项目的频度排序；一次将数据库信息转变成紧缩内存结构。

不使用侯选集，直接压缩数据库成一个频繁模式树，通过频繁模式树可以直接得到频集。

基本步骤是：
·两次扫描数据库，生成频繁模式树FP-Tree：

    ·扫描数据库一次，得到所有1-项目的频度排序表T；
    ·依照T，再扫描数据库，得到FP-Tree。

·使用FP-Tree，生成频集：

   ·为FP-tree中的每个节点生成条件模式库；
   ·用条件模式库构造对应的条件FP-tree；
   ·递归挖掘条件FP-trees同时增长其包含的频繁集：
        -如果条件FP-tree只包含一个路径，则直接生成所包含的频繁集。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

为每个节点，寻找它的所有前缀路径并记录其频度，形成CPB
在这里插入图片描述

为每一个节点，通过FP-tree构造一个C-FP-tree
例如，m节点的C-FP-tree为：
在这里插入图片描述

在这里插入图片描述

关注