![edbdbf1bd1d13c85630ed7b98d10553f.png](https://img-blog.csdnimg.cn/img_convert/edbdbf1bd1d13c85630ed7b98d10553f.png)
【论文Summary】Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping
标签(空格分隔): 论文Summary NLP
![acb4bc19e17972fe5b03b5421b82e756.png](https://img-blog.csdnimg.cn/img_convert/acb4bc19e17972fe5b03b5421b82e756.png)
1. 主要解决的问题
这篇论文是针对DTW(Dynamic Time Warping)算法进行了一些优化,目的是用一段时间序列片段T1,在大规模的时间序列T2中,更快的找到与片段T1相似的时间序列段。
举个例子:网易云音乐去推荐相似的音乐,通过你唱的小片段,然后在音乐库中找出相应的歌曲。
2. 一些定义
2.1 ED
常用欧式距离来衡量两个一维的时间序列Q和C的相似度。计算公式如下:
如果两个时间序列长度相等时,最直观的办法就是将两者固定到时间轴上,逐个计算每个时间点对应的值的距离和:(如图中的灰色阴影区域)
![f141f7302a05a5f8cac613825afe6985.png](https://img-blog.csdnimg.cn/img_convert/f141f7302a05a5f8cac613825afe6985.png)
但是ED是两个序列间的一对一的映射,当Q和C形状上相似,但是有时间点上有相位差时,算出的相似度会有比较大的偏差。而DTW可以很好的解决这个问题。
2.2 DTW
DTW的做法相当于是把两个时间序列进行对齐后,求算出一个差异矩阵,目标是在矩阵中找到一条从(0,0)到(n,n)的路径,使得该路径上的元素的累加欧拉距离最小,这样的一条路径被称为wraping path。
![8e75e9fc1f29acb8dad25e129bc40b7a.png](https://img-blog.csdnimg.cn/img_convert/8e75e9fc1f29acb8dad25e129bc40b7a.png)
- 差异矩阵
构造一个
2. Wraping path
Wraping path定义了时序Q和C之间的映射,记作P。是一组连续的矩阵元素,P的第
注: 欧式距离相当于DTW的特例,对应的warping path为从矩阵左下角到右上角的对角线;
3. Wraping path的条件
1. 必须在矩阵的对角单元格中开始和结束
2. 步长被限制为相邻