数据挖掘-序列模式挖掘-PrefixSpan算法(ppt版本)

PrefixSpan算法

通俗来讲:前缀prefix就是序列数据前面部分的子序列

后缀:对于某一个前缀,序列中除去前缀后面剩下的子序列就是我们的后缀。

投影数据库:假设alpha是序列数据库 S的一个序列模式,那么alpha的投影数据库就是它在S 中关于前缀alpha的序列的后缀的集合。

投影数据库的支持度:相当于现在beta(beta是一个带前缀alpha的序列)支持度不是再在原始数据库中去找了,而是在alpha的投影数据库里面找了。

思想:之前计算某一个(候选)序列的支持度计数,都是拿着该(候选)序列去原始数据库里面去找,但是有了投影数据库的概念,我们上面证明了该(候选)序列在原始数据库中的计数等于该(候选)序列在与之对应的投影数据库中的计数。我们的prefixspan算法中就是在投影数据库里面计数支持度的。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值