Mining Sequential Patterns by PrefixSpan算法

最新推荐文章于 2020-05-23 19:49:07 发布

weixin_34205076

最新推荐文章于 2020-05-23 19:49:07 发布

阅读量229

点赞数

prefixspan算法韩家炜老师在2001年提出的序列模式算法，该算法和他在2000提出的FP_growth算法有很大的相似之处，都避免产生候选序列。

prefixspan算法的核心是产生前缀和对应的后缀，每次递归都将合适的后缀变为前缀。难点是类似：<a x>，<(a x)>和<(_ x)>，后两种可以做一类处理。现以下图所示的超市购物数据详细讲解，阈值是2=4*50%。

概念介绍：每行数据叫序列，可以理解某人第一天买了商品a,b,c,第二天又买了商品a,b,c，第三天买了商品a,c。某天买的总商品叫项目如：a,b,c。每件商品叫元素如a。

第一步：按每个元素排序，每个元素在一个序列中即使出现多次，也只算一次，然后删除不满足阈值的元素，这里只删除了元素g,结果如下图：

第二步：找前缀分别为a,b,c,d,e,f的后缀，那么这些后缀是相互独立，互不影响的。这是算法的关键。前缀a和b的后缀如下图：

这里的下划线"_"表示它就是前缀，并且该项目还有其他元素。

第三步：在各个后缀中分别递归的讲后缀变成前缀。以前缀a为例。前缀为<a b>的后缀是：

后面的4表示前缀为<a b>出现了4次，分别是下面两次,第三次是空的，表示前缀<a b>后面没有项目了。前缀为<(a b)>的后缀是：

注意前缀<a b>和<(a b)>是有区别的。前者表示元素a,b在不同的项目里面，而后者表示元素a,b必须在同一个项目里面。这代表了两种不同的情况。这一步可以一直递归下去，知道全部后缀变成前缀为止。下面就前缀<a b>继续分析，它会生成前缀为<a b c>的后缀：

此时，再没有合适的后缀可以转换成前缀了，结束递归。前缀为<a (b c)>的后缀：

这个后缀还可以继续转换成前缀，有：

此时，再没有合适的后缀可以转换成前缀了，结束递归。于是整个前缀为<a b>的所有情况的找出来了。类似的可以找出前缀为b,c,d,e,f的部分。

论文下载：地址

weixin_34205076

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Mining Sequential Patterns by PrefixSpan算法

prefixspan算法韩家炜老师在2001年提出的序列模式算法，该算法和他在2000提出的FP_growth算法有很大的相似之处，都避免产生候选序列。 prefixspan算法的核心是产生前缀和对应的后缀，每次递归都将合适的后缀变为前缀。难点是类似：&lt;a x&gt;，&lt;(a x)&gt;和&lt;(_ x)&gt;，后两种可以做一类处理。现以下图所示的超市购物数据详细讲解...
复制链接

扫一扫

weixin_34205076 CSDN认证博客专家 CSDN认证企业博客

码龄8年

150: 原创

-: 周排名

227万+: 总排名

129万+: 访问

: 等级

7515: 积分

5051: 粉丝

175: 获赞

17: 评论

1198: 收藏

私信

关注

热门文章

最新评论

浅谈区块链底层架构：你为什么是你，而不是我？
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。
关于音视频测试的一点建议
m0_53616202: 想问下这个方向怎么样呀，学完c++不知道往哪个方向，对嵌入式也不感兴趣
【GoLang】类型和作用在它上面定义的方法必须在同一个包里定义
php初学的菜鸟: 实测,根本不是,A包可以实现B包的接口,没毛病,方法名大写,一致,返回值类型一致就OK
关于音视频测试的一点建议
大鼠的: 我也在音视频实验室工作哎，也是测sdk的，最近离职了，在找新工作，想多看看音视频的知识，没想到在这里能看到大佬，写得非常好，对我有很大的帮助
solr7.4定时/实时更新/重建索引配置，及报错404问题解决方案
qq_38993560: 哥们你这问题怎么解决的，下载这个包不能用，给我说一下，给你充话费

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。