引言
时间数据在许多学科中的扩散和无处不在,已经对时间序列的分析和挖掘产生了极大的兴趣。聚类是最流行的数据挖掘方法之一,不仅因为它的探索性,而且作为其他技术的预处理步骤或子程序。常用的有-means聚类算法。本文介绍了一种新的时间序列聚类算法k-Shape。k-Shape依赖于一个可扩展的迭代优化过程,它创建同质和良好分离的集群。作为距离度量,k-Shape使用标准化的交叉相关。基于距离度量的性质,我们开发了一种计算聚类质心的方法,在每次迭代中使用聚类质心来更新时间序列对聚类的分配。
我们讨论了一种新的基于形状的时间序列聚类算法k-Shape。k-Shape基于与k-means算法类似的可扩展迭代细化过程,但存在显著差异。具体来说,kShape使用了与k-means不同的距离度量和质心计算方法。如上所述,k-Shape在比较时间序列序列时试图保留它们的形状。要做到这一点,kShape需要一个距离度量,它对缩放和移动是不变的。与其他聚类方法不同,对于k-Shape,采用了相互关联的统计度量,展示了:(i)如何以一种原则性的方式推导出尺度和位移不变的时间序列距离度量。(ii)如何有效地计算这个距离度量。基于互相关归一化版本的特性,我们提出了一种新的聚类质心计算方法,在每次迭代中使用聚类质心来更新时间序列对聚类的分配。
参考文献
Paparrizos J , Gravano L .k-Shape: Efficient and Accurate Clustering of Time Series[J].ACM SIGMOD Record, 2015, 45(1):69-76.DOI:10.1145/2723372.2737793.
"Fast and Accurate Time-Series Clustering"John Paparrizos and Luis Gravano,ACM Transactions on Database Systems (ACM TODS 2017), volume 42(2), pages 1-49
Matlab代码下载
微信搜索并关注-优化算法侠(英文名:Swarm-Opti),或扫描下方二维码关注,以算法名字搜索历史文章即可下载。
点击链接跳转:
380种群优化算法免费下载-matlab
求解cec测试函数-matlab
cec2022测试函使用教程及matlab代码免费下载
绘制cec2017/018/2019/2020/2021/2022函数的三维图像教程,SO EASY!