论文标题:
MiniRocket: A Very Fast (Almost) Deterministic Transform for Time Series Classification
论文链接:
https://www.xueshufan.com/publication/3190461479
代码链接:
https://github.com/angus924/minirocket
摘要
Rocket通过使用随机卷积核转换输入时间序列,并使用转换后的特征训练线性分类器,以较低的计算成本实现了最先进的时间序列分类精度。我们将Rocket重新定义为一种新的方法,MiniRocket。在更大的数据集上,MiniRocket的速度是Rocket的75倍,而且几乎是确定的(也可以是完全确定的),同时保持基本相同的精度。使用这种方法,可以在10分钟内对UCR档案中的109个数据集进行训练和测试分类器,达到最先进的精确度。MiniRocket比任何其他具有相同精度的方法(包括Rocket)都要快得多,而且比任何其他具有远程相似计算费用的方法都要精确得多。
方法
minirocket需要做一些关键的改变,以便从rocket中移除几乎所有的随机性,并利用这些改变来显著加速转换。然而,请注意,minirocket的目标不一定是最大化精度本身,而是平衡精度与参数选择,消除随机性,有利于优化转换。
Rocket使用从{7,9,11}中随机选择长度的核,从N(0,1)中提取权重,从u(−1,1)中提取偏差项,随机膨胀和随机填充。每个内核计算两个特征,PPV和max,总共20,000个特征。MiniRocket的特征是内核在长度、权重、偏置、膨胀和填充方面的一些关键变化,以及导致的特征变化。
总之,通过对参数设定规则或设定具体值,从而缩小了参数的范围,在不降低准确率的情况下提升了速度。
分类器
如果有更多的样本,则从脊回归换为逻辑回归。
实验
准确率差不多,速度有极其显著的提升。
总结
未来可以研究多变量时间序列以及使用非线性分类器的情况。