Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping

西西弗的小蚂蚁

于 2022-06-08 00:06:14 发布

阅读量268

点赞数

分类专栏：时间序列聚类文章标签：数据挖掘聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zj_18706809267/article/details/125125919

版权

时间序列聚类专栏收录该内容

45 篇文章 10 订阅

订阅专栏

大多数时间序列数据挖掘算法都将相似度搜索作为核心子程序，因此相似度搜索的时间是几乎所有时间序列数据挖掘算法的瓶颈。将搜索扩展到大型数据集的困难在很大程度上解释了为什么大多数时间序列数据挖掘的学术工作停留在考虑几百万个时间序列对象，而许多工业和科学领域却有数十亿个时间序列对象等待探索。在这项工作中，我们表明，通过使用四个新的想法的组合，我们可以搜索和挖掘真正大规模的时间序列第一次。我们证明了以下极不直观的事实;在大型数据集中，我们可以在DTW下精确搜索，比目前最先进的欧几里得距离搜索算法快得多。我们在有史以来最大的时间序列实验中展示了我们的工作。特别地，我们考虑的最大数据集比所有已发表的数据挖掘论文中考虑的所有时间序列数据集的总和还要大。我们表明，我们的想法允许我们解决更高级别的时间序列数据挖掘问题，如motif发现和聚类规模，否则将是站不住脚的。除了挖掘海量数据集，我们还将展示我们的想法对数据流的实时监控也有影响，使我们能够处理更快的到达率和/或使用比目前可能的更便宜、更低功率的设备。

西西弗的小蚂蚁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping

大多数时间序列数据挖掘算法都将相似度搜索作为核心子程序，因此相似度搜索的时间是几乎所有时间序列数据挖掘算法的瓶颈。将搜索扩展到大型数据集的困难在很大程度上解释了为什么大多数时间序列数据挖掘的学术工作停留在考虑几百万个时间序列对象，而许多工业和科学领域却有数十亿个时间序列对象等待探索。在这项工作中，我们表明，通过使用四个新的想法的组合，我们可以搜索和挖掘真正大规模的时间序列第一次。我们证明了以下极不直观的事实;在大型数据集中，我们可以在DTW下精确搜索，比目前最先进的欧几里得距离搜索算法快得多。我们在有史以来
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。