拐点检测常用算法总结

最新推荐文章于 2024-07-05 13:09:01 发布

赵孝正

最新推荐文章于 2024-07-05 13:09:01 发布

阅读量4.8k

点赞数 2

分类专栏： python数据分析案例------ 文章标签：算法深度学习人工智能

本文链接：https://blog.csdn.net/weixin_46713695/article/details/128700230

版权

python数据分析案例------ 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

文章探讨了拐点检测问题，特别是针对不平缓时间序列的突变点识别。通过定义拐点并提出评估算法质量的标准，阐述了如何利用损失函数和对比函数进行序列的均匀性测量。文章讨论了两种情况下的离散优化问题，即固定和非固定拐点数量，并强调了合理约束的重要性。损失函数在这一过程中起到关键作用，用于判断子序列的均匀程度。

摘要由CSDN通过智能技术生成

概览

问题定义

拐点检测名为 change point detection，对于一条不平缓的时间序列曲线，认为存在一些时间点 $t_1 , t_2 , . . . , t_k )$ ，使得曲线在这些点对应的位置发生突变，这些时间点对应的曲线点称为拐点，在连续的两个拐点之间，曲线是平稳的。
在这里插入图片描述
拐点检测算法的质量，通过算法输出拐点与实际观测到的拐点的差值绝对值除以样本数来评估。

理想情况下，当样本数 T 无穷大时，误差应该减少到 0，这种性质称为满足渐近一致性 (asymptotic consistency.)
在这里插入图片描述

符号定义

$y_{a..b}$ 表示时间点 $a$ 和 $b$ 之间的时间序列，因此完整信号为 $y_{0..T}$ 。

对于给定的拐点索引 $t$ ，它的关联分数 associate fraction 称为拐点分数 change point fractions ，公式为：
在这里插入图片描述
拐点分数的集合 $\pmb{τ} = { τ_1 , τ_2 , … }$ ，写作 $\boldsymbol{|\tau|}$ 。

研究方法

一般思路是构造一个对照函数 contrast function，目标是将对照函数的值最小化。
在这里插入图片描述
其中 $c(\cdot)$ 表示用来测量拟合度 goodness-of-fit 的损失函数 cost function，损失函数的值在均匀的子序列上较低，在不均匀的子序列上较高。