Summary-1: Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping

最新推荐文章于 2023-08-10 07:54:45 发布

CH-YYK

最新推荐文章于 2023-08-10 07:54:45 发布

阅读量451

点赞数

分类专栏： Dynamic Programming DTW Time-series Paper-summary

本文链接：https://blog.csdn.net/github_38243220/article/details/96089480

版权

Paper-summary-1, Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping

ref: Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping

首先整篇文章主要讲的是一系列针对 DTW 算法的时间优化策略，还包括与一部分主流的同类算法的效果对比，而且根据paper中所列的结果来看，这些优化策略在时间上确实表现出来了明显的提升，非常值得借鉴。
在这里DTW的全称是“Dynamic Time Warping”，本身是一个衡量两个序列相似程度的算法，而且在众多相关文章的验证下，可以说是针对时间序列问题的最好算法之一，但同时它也存在着同类算法的共同瓶颈问题，时间复杂度较高而无法适用于“大”数据。而这也是本篇paper旨在解决的。

How does DTW (Dynamic Time Warping) work

**Explaination:**假设已知两个序列 $X$ 和 $Y$ ，长度分别为 $M$ 和 $N$ 。当 $M = N$ 的时候，此时最简单且直接的办法就是算“点对点”的欧式距离，但局限就是要求X与Y的序列长度相同，而显而易见这个并不能保证任何场景都满足。当两者都不等长时候，就不能像理想状况那样找到唯一且符合常识的对应关系，在这种情况下，我们需要综合考虑两个序列所能构成的所有“点与点”之间的对应关系（或者说是X上的任意点与Y上的任意点的距离），这样我们总共可以获得 $M \times N$ 对点，也就是 $M \times N$ 个“距离”。如果我们将这些距离用一个M×N的矩阵表示出来 $\in R^{M\times N}$ ，在这里元素 $Cost_{i,j}$ 指的就是X上的index 为i的值与Y上index为j的值的距离。为了获得一个可以表示similarity的数字（这里定义为 $c o s t$ ），DTW提供了一个基于该矩阵获得measure的思路：找一条起始于 $（ 0, 0 ）$ 终于 $（ M - 1 ， N - 1 ）$ 而且monotonic的路径，要求该路径所覆盖的“距离”总和最小。问题也因此被简化为了一个动态规划中的“最短路径”问题。

Definitions and Notations

Definition-1: 定义有序序列

最低0.47元/天解锁文章

CH-YYK

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Summary-1: Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping

Paper-summary-1, Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warpingref: Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping首先整篇...
复制链接

扫一扫