数据挖掘-序列模式挖掘-基础知识和概念总结(sequential pattern mining)

一:基础概念介绍

序列模式挖掘:指挖掘相对时间或其他模式出现频率高的模式

序列模式挖掘的动机:大型连锁超市的交易数据有一系列的用户事物数据库。每一条记录包括用户的ID,事物发生的时间和事物涉及的项目。如果能够在其中挖掘涉及事物间关联关系的模式,即用户几次购买行为间的联系,可以采用更有针对性的营销措施。

序列:(sequence) 以SID表示,一个序列即是一个完整的信息流

序列符号化表示:序列是不同项目集的有序排列。序列s可以表示为s = <s1,s2,s3,.....,sl>, sj(1<= j <= l)为项目集(itemset),也称为序列s的元素

序列的长度:序列的元素可以表示为(x1,x2,x3,....,xm),xk (1<= k <= m)为不同的项目。一个序列中所包含的所有项的个数称为序列的长度

项目:(item) 序列中最小组成单位的集合。e g: {A,B,C}.

事件:(event)通常用时间戳标志,标识事件的前后关系,又叫itemset.是item的集合

项目集:(itemset)是各种项目组成的集合

k-频繁序列:如果频繁序列项目个数为K,称为k频繁序列。eg:<面包,苹果> 为2频繁序列 

序列

  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值