【时序分割】2017KDD论文 Toeplitz Inverse Covariance-Based Clustering of Multivariate Time Series(TICC)

该博客介绍了2017年KDD论文《Toeplitz Inverse Covariance-Based Clustering of Multivariate Time Series Data》(TICC),提出了一种针对多元时间序列数据的聚类方法。TICC利用Toeplitz逆协方差矩阵,结合动态规划和ADMM算法解决实时分割和聚类问题,适用于传感器数据的模式发现和压缩。文章详细阐述了算法原理、动态规划和ADMM在点分配和参数更新中的应用,并通过实验证明了其有效性和优于传统距离度量方法的性能。
摘要由CSDN通过智能技术生成

             基于Toeplitz逆协方差的多元时间序列数据聚类

Toeplitz Inverse Covariance-Based Clustering of Multivariate Time Series Data

文章网址:https://www.researchgate.net/publication/318916788_Toeplitz_Inverse_Covariance-Based_Clustering_of_Multivariate_Time_Series_Data

作者:David Hallac, Sagar Vare, Stephen Boyd, Jure Leskovec     斯坦福大学

github中有代码:https://github.com/davidhallac/TICC

相关连接:(此论文相关的两个分享,可做参考)

https://blog.csdn.net/shenxiaolu1984/article/details/78134471

https://blog.csdn.net/guohao_zhang/article/details/78155520

 

目录

一、文章梳理

二、代码梳理

三、总结思考


一、文章梳理

ABSTRACT

 1、提出子序列分类的意义,一旦能够发现模式,复杂的数据库将可以用少数的状态量表示(数据压缩)并举出健身传感器数据的例子来说明(走、停和跑三个状态构成了时间线)

2、提出发现模式挖掘的困难和挑战,一是需要实时分割和时序聚类,二是结果的可解释性

3、提出本文的方法TICC,简要该方法中介绍类的定义问题、运用EM算法中的一个变量解决TICC问题,运用动态规划和ADMM(alternative direction method of multipliers)来解决两个结果的子问题

4、文中通过对比证明了本方法的有效性。

5、本文解决TICC问题提出了三个算法,EM算法、动态规划算法,ADMM算法。简单可以这样理解,EM算法只是提供一种解决问题的思路和框架,即估计+更新,不断循环进行,得到最优解。动态规划算法完成点分配到类问题(E-step),ADMM完成各参数的迭代计算和更新(M-step),简易图如下:(总体文章的思路在总结中再进行阐述)

1 INTRODUCTION

1)简介长序列的分割。a.当前有很多传感器会产生长序列数据,b.长序列可以由一系列状态(模式)的时序组合来表达,c.举出两个例子。这些表达可以用于发现重复的模式,检测异常,表达高维的数据。

2)对时序数据的实时分割和聚类是很有必要的。a) 引用文献,将时序数据的实时分割和聚类与单纯的分割或是聚类进行对比,介绍其不同之处和难点。b) 即使分类后,对结果的解释也是比较困难的。c) 传统的聚类算法主要依赖于距离测度,不适合该问题。

3)本文提出的新方法(TICC)。类的定义,MRF(马尔可夫随机场)的作用

4)通过估计一个稀疏的高斯逆协方差矩阵来学习MRF类。

5)EM算法、动态规划算法,ADMM算法

6)在真实的数据库和合成的数据库上使用TICC算法

7)Related Work相关工作。(time series cluster

  • 4
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 14
    评论
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值