动态时间规整_‘DTW检索和挖掘万亿级时间序列数据’阅读笔记

d96fbf1b39073a5e9367901b6fd3b212.png

文章:Searching and mining trillions of time series subsequences under dynamic time warping

来源:KDD2012

一、笔记概述

阅读论文的研究对象是“如何快速的计算两个并未完全对齐的时间序列数据(Time series data)之间的距离,确认其对齐后(即二者最小距离时)能否达到相似的标准,从而实现从万亿级数据中寻找相似片段的目标。”利用的方法是对动态时间规整算法(Dynamic Time Warping,后文简称DTW)进行改进。

二、朴素DTW逻辑

  1. 何为两个序列的距离

DTW核心是将两个不同的序列按照对齐后比较,而如何才是最好对齐呢?对齐的方式有很多,最好的对齐方式就是两个序列的距离最小,同时这个最小的距离即被定义为两个序列的距离。

484072cfb99d043c5e39d0eb8a64e1d8.png
论文中Q表示query,是我们查询的母体;C表示candidate,是所有需要和Q进行比较匹配的候选者集合

如图所示,两条长度不同的序列Q,C,假设Q的序列长度为n,而C的序列长度为m,那么我们需要构建一个n*m的矩阵,其中矩阵元素(i,j)表示Qi和Cj之间的距离。每个矩阵元素表示Qi和Cj对齐,那么从矩阵左下角到右上角可以找到很多路径(从左下角到右上角是因为两个不同的序列无论长短,它们的起始点和终止点肯定是对应的),

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值