样本熵与近似熵：度量时间序列复杂性的方法

小桥流水---人工智能

于 2024-08-04 21:57:59 发布

阅读量497

点赞数 14

分类专栏：人工智能深度学习机器学习算法文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/qlkaicx/article/details/140912654

版权

284 篇文章 13 订阅

订阅专栏

280 篇文章 3 订阅

订阅专栏

66 篇文章 0 订阅

订阅专栏

在分析时间序列数据时，了解序列的复杂性对于理解其内在动态非常关键。样本熵（Sample Entropy）和近似熵（Approximate Entropy）是两种常用的统计工具，用于度量时间序列的复杂性和预测难度。本文将详细介绍这两种方法的原理、差异及其应用。

近似熵是一种衡量时间序列复杂性的统计量，由Steve Pincus于1991年提出。它的基本思想是衡量时间序列中相似模式的频率，其中相似性由给定的容忍度决定。时间序列越随机，其相似模式出现的频率越低，近似熵值越高，反之亦然。

样本熵是基于近似熵改进的一种方法，由Richman和Moorman于2000年提出。样本熵在计算过程中不考虑序列内相同数据段的比较，从而避免了近似熵中的自匹配偏差，通常认为样本熵在小数据样本上更为准确和一致。

选择嵌入维度和容忍度：与近似熵相同。
构造向量：与近似熵相同。
计算不包含自匹配的相似度：计算每个向量与其他向量的距离，忽略自匹配的情况。
计算概率：计算向量间距离小于 $r$ 的概率，但不包括向量自身。
计算样本熵： $-\ln(\frac{A}{B})$ ，其中 $A$ 是在 $m + 1$ 维时相似的向量对数， $B$ 是在 $m$ 维时相似的向量对数。

通过使用样本熵和近似熵，研究者和分析师可以更好地理解时间序列数据的内在结构和复杂性，从而提高预测模型的准确性和效率。

关注

专栏目录