《Periodicity Detection in Time Series Databases》论文阅读笔记

《Periodicity Detection in Time Series Databases》论文阅读笔记

论文思想

论文中描述了两种周期模式:段周期和符号周期。对于符号周期设计了卷积算法来发现周期;

3.2符号周期

这是论文里面的描述
提到 了一个定义,πp,l 它是周期为p,起始位置为l,从时间序列T中获得的一个序列。
例如:T=abcabbabcb,π4,1(T)=bbb,π3,0(T)=aaab。但是对于b来说,周期为3,就说它的频率为1/4是不准确的(得到的序列是bbb)。

为了解决这个问题,我们只考虑连续出现。符号s在πp,l(T)的投影上的连续出现描述的是符号s在T中在经过p时间后s在前一次出现后再出现,它说明对于符号s来说p是一个潜在的周期。

令F2(s,T)表示符号s在时间序列T中两个连续位置出现的次数,例如T=abbaaabaa,那么F2(a,T)=3,F2(b,T)=1,F2(a,T)=3是因为在T中,a,aaa,aa这三个出现a的位置其中连续出现的次数和为2+1=3。

定义一

3.2.1模糊周期模式

定义1的主要优点是,它不仅确定候选周期符号,而且还确定它们的相应周期并定位它们的相应位置。 因此,没有周期值的假设,因此,模糊的周期性模式可以定义如下:
定义二
在这里插入图片描述
采用定义2构成的单个符号模式的支持度是采用公式进行定义的,例如T=abcabbabcb,模式a**是一个长度为3,支持度为2/3的单个符号模式。模式*b*是支持度为1。但是对于ab*来说,我们不能估计这个模式的支持度,所以不能推测这个模式也是一个周期。唯一我们可以确定的是它的支持度不超过2/3。
定义3

3.3分段周期

符号周期关注的是符号,不同的符号可能有不同的周期,而分段周期关注的是整个时间序列。如果一个时间序列T能够被等分成长度为p的几乎一样的段,那么T是一个以p为长度的周期。例如T=abcabdabc是一个长度为3的周期,尽管第二段abd和其他的段不一样。
比较两个段之间的距离采用的是Hamming distance:
段之间距离表达方式
u,v是长度为m的段,S(u,v)表示的是相似性度量方法,值越大相似性越高,当u=v时,S(u,v)=1。段周期性定义如下:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值