论文阅读_时序模型Shapelet

基本信息

原理

2009年,Ye和Keogh在KDD上发表论文,首次提出了时序数据中的 Shapelet 的概念。Shapelet是最近邻算法的扩展,它提取最典型的特征子集作为判断依据。

例如:马鞭草和荨麻的叶片很相似,如果将它们的叶片边缘形状整体作为序列建模,则难以区分。

它们的重要差别是叶柄与叶片之间的角度,一个是直角,一个是钝角。因此,如果使用序列中的小片断(子序列)作为序列的表征,就很容易将二者区分开来。

优缺点

优点

  • 具有可解释性
  • 鲁棒性强
  • 相对于最近邻算法速度快

缺点

  • 算法相对简单,花费时间较长
  • 一般用于二分类和聚类,不支持多分类

用途

  • 训练分类模型
  • 解释分类原因
  • 用于选择时间区间和维度

方法

算法的核心是如何找到最有代表子序列(文章第三部分)。首先使用滑动时间窗口获取所有可能子序列,然后,使用使信息增益高的作为切分策略。

暴力找

其最简单的实现方法包含如下两步:

  • 利用穷举方法找到所有可选子序列作为备选项。
  • 找到其中信息增益(该子序列能否能更好区分不同类别)最大的片断。
    后面的方法都基于这个算法。

     

     

    其中D是训练使用的数据集,取滑动窗口的长度最小为MINLEN,最长为MAXLEN的所有子序列作为候选集Candidates,函数CheckCandidate()用于计算信息增益,具体方法是计算每个时间序列到候选对象的距离。将其放在实数线上,并标注上类别。

     


    可以看到,如果其中某个候选者,所有正例离它都近,所有反例离它都远,也就是说它可以很好地区分二者,则它的信息增益较大。
    其中一个序列T与了一个子序列S的距离被定义为:
    SubsequenceDist(T, S) = min(Dist(S, S'))

    其中S'是序列T的子序列,在序列T中查找与子序列S最近似的子序列S‘,并计算S到S'间的距离。因此,不需要把叶子方向摆正,只要两片叶子里包含相似的子序列就能找到。

子序列早弃

为减少计算量,在计算过程中发现距离比已知最大的距离还大时,则不再继续计算。

熵剪枝

为减少计算量,在计算过程中如果信息增益比当前值还小,则不再继续计算。

在几种方法中,熵剪枝速度最快

用法

  • 安装
    代码集成在pyts包中(1.1K Star),pyts是处理时间序列的类似scikit-learn的函数库。
$ pip install pyts

启发

  • 可以将时序看作决策树,子序列看作特征。
  • 找到最典型的特征,类似于人的思考方式。
Shapelet算法是一种用于时间序列分类的方法。它通过寻找时间序列中具有代表性的子序列,即shapelet,来进行分类。Shapelet算法具有以下几个主要特点和应用: 1. 加速shapelet发现:传统的shapelet发现过程非常耗时,因此研究者提出了许多加速shapelet发现的方法,如快速Shapelet算法(FSH)、可扩展发现算法(SD)和超快速Shapelet算法(UFS)等。 2. Shapelet变换:为了将时间序列数据转换为可以由其他分类算法使用的特征空间,研究者提出了shapelet变换方法。这些方法使用shapelet将时间序列数据转换为特征向量,然后可以使用传统的分类算法进行分类。 3. 基于距离的方法:基于距离的shapelet分类器使用时间序列之间的距离来进行分类。常见的方法包括计算时间序列和shapelet之间的距离,并将其作为分类的依据。 4. 基于特征的方法:基于特征的shapelet分类器使用从时间序列中提取的特征来进行分类。这些特征可以是统计特征、频域特征或其他特征,通过提取这些特征并使用分类算法进行分类。 5. 基于集合的方法:基于集合的shapelet分类器使用多个shapelet来进行分类。这些shapelet可以是从训练数据中提取的,也可以是预定义的。通过计算时间序列与每个shapelet之间的距离,并使用投票或加权投票的方式进行分类。 6. 深度学习方法:近年来,深度学习方法也被应用于shapelet分类。这些方法利用深度神经网络来学习时间序列的表示,并进行分类。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值