24-BSPC-Opening the envelope: Efficient envelope-based PPG denoising algorithm

本文链接：https://blog.csdn.net/zhn_666/article/details/141561321

Abstract

从皮肤表面获得的光容积脉搏波(PPG)信号为血容量波动提供了有价值的见解。随着对连续无创生理监测的兴趣日益浓厚，PPG已经引起了人们的广泛关注。然而，PPG信号经常受到各种形式的噪声的影响，阻碍了可靠的特征提取。稳健的数据预处理方法对于回顾性和实时分析都是至关重要的。现有的去噪方法，包括最近的机器学习技术，经常遭受实现挑战，计算效率低下和有限的可解释性三个问题。针对这一挑战，我们提出了一种新的PPG去噪算法。该算法使用来自31名患者的约81,015.99分钟或1360.27小时的PPG数据集进行评估。评估涉及五个关键指标的计算和分析:信噪比(SNR)、方差、总变异(TV)、香农熵和每秒实例数(IPS)。我们的研究结果表明，去噪后信噪比显著提高，表明在保留信号内容的同时有效地降低了噪声。方差和TV值后去噪后减小，表明信号更平滑，变化更少，验证了噪声抑制效果。去噪后Shannon熵减小，表明去噪成功，信号的规律性增强。采用非参数Wilcoxon有符号秩检验(a = 0.05)评价去噪前后各指标差异的统计学意义。此外，计算速度分析揭示了EPDA在高效处理大型数据集和实时应用方面的潜力。这种全面的评估方法可以全面了解EPDA在去噪PPG数据方面的有效性，促进非侵入性生理监测的进步，并促进基于PPG的医疗技术的广泛采用。

Introduction

光体积脉搏波(PPG)信号是非侵入性的，具有成本效益的光学信号，使用光源和光电探测器很容易从皮肤表面获得。PPG信号通过检测由血容量变化引起的光吸收或反射的变化来捕获有关血容量波动的信息。对无创生理监测的兴趣日益增长，加上医疗保健向持续和无处不在的患者监测而不是独家住院护理的范式转变，引发了PPG技术的采用和探索的显著激增[1-3]。在过去的二十年中，与PPG相关的搜索结果显著增加，增加了2392.72%，这一点在PubMed, Europe PubMed Central和Scopus中从2000年到2022年的“Photoplethysmography”或“Photoplethysmogram”的搜索结果中得到了证明，如图1所示。

Fig1
同样的趋势也导致了非侵入性医疗设备以及面向消费者的可穿戴设备(如智能手表和健身追踪器)的激增。这些设备中有许多使用PPG技术使各种生理指标，包括心率，血压，血氧饱和度和睡眠模式的无创和连续监测成为可能。
似乎有理由认为，基于ppg的监测有可能破坏医疗保健。然而，尽管前景看好，但PPG信号本身就容易受到各种形式的噪声的影响，这些噪声会扭曲信号，给获取可靠和准确的信息带来挑战。噪声源包括电力线干扰、低频和高频噪声、基线漂移、运动伪影和光致光电二极管饱和[4]。这种噪声的普遍存在强调了数据去噪方法对回顾性和实时信号处理和分析的重要性。针对这些挑战，我们提出并评估了一种新的基于包络的去噪算法，以下称为“包络PPG去噪算法”(EPDA)，旨在实现两个目标:(i)识别和去除异常数据，同时保留去除数据的指标，以及(ii)保证计算效率，认识到实时处理和资源利用的实际限制。

我们区分了两种主要的去噪方法:(i)异常检测去噪和(ii)基于滤波器的去噪。异常检测去噪是指识别和消除数据集中不需要的异常数据点或索引的方法。另一方面，基于滤波器的去噪涉及通过选择性地允许或衰减特定频率分量来修改信号的频率内容。

在这些定义中，EPDA被归类为一种异常检测去噪方法。在处理连续标记的数据集时，基于异常检测的去噪被证明特别有价值，其中保持数据和标签源之间的同步是至关重要的。该方法包括存储异常数据的索引，便于从去噪数据和标签源的相应索引中删除异常数据点，从而保持数据-标签的完整性。

目前，针对非滤波PPG去噪的研究还很缺乏。最近，机器学习(ML)技术用于去噪的使用有所增加。Lee等人引入了一种用于PPG去噪的双向循环自编码器(BRDAE)，在验证过程中，对噪声增强数据的信噪比提高了7.9 dB[5]。Kwon等人提出了一种基于变压器的深度生成模型来消除PPG信号中的噪声[6]。mohaghghian等人开发了一种卷积自编码器降噪方法，将动脉颤动和非动脉颤动数据的平均检测心率和均方根误差(RMSE)分别降低了45.74%和23%[7]。Xu等人创建了一个运动伪影去除时滞神经网络(TDNN)，该网络使用信号包络对PPG信号幅度进行归一化，同时保留其他波形特征，如主导频率和脉宽[8]。也有其他的统计方法去噪。Lin等人介绍了一种去噪方法，该方法通过使用基准点(起始点、峰值点和偏移点)计算特征来表征信号，并使用自适应阈值对信号的异常片段进行分类和去除[9]。Dao等人提出了一种利用时频谱(TFS)特征的运动伪迹检测算法[10]。这些TFS特性有助于区分运动伪影损坏的数据段和干净的数据段。当将EPDA与其他去噪算法进行比较时，会出现实质性的区别。EPDA作为一种统计方法，与ML方法相比具有明显的优势，主要是在增强的透明度和可解释性方面，这些方面固有地嵌入在统计方法中，但通常在ML方法中缺乏。

用于去噪的机器学习技术通常需要大量标记数据来进行有效的训练，这是一种可能不易访问或不易生成的资源。此外，某些去噪方法试图重建被噪声污染的PPG数据，这可能会导致未损坏的PPG信号中存在的重要特征的丢失。

该领域的一些算法专门针对HR(心率)和SpO2(氧饱和度)信息的捕获，忽略了保留信号形态和振幅的重要性，这可能对其他生理标记具有重要意义[11,12]。

虽然某些研究利用了信号包络，但这种使用通常发生在去噪本身不是中心的步骤。例如，它已被用作数据归一化或识别噪声数据中的基点的预处理步骤[8,13]。据作者所知，目前还没有一种降噪方法利用包络差(计算为信号上下包络的绝对差)作为降噪的基础。EPDA的另一个特性，在许多去噪方法中并不普遍，是保留已识别异常数据的指标。在处理同步标记数据时，这种保存变得特别有价值。现有的统计降噪方法往往通过计算光谱特征、数据变换或计算每个脉冲周期的形态特征来产生大量的计算成本。

我们假设EPDA通过包络差的有效计算和使用包络差来表征信号，相对于其他去噪方法产生更低的计算费用，这在考虑将算法应用于回顾性或实时使用大型数据集时变得尤为重要。

因此，建议EPDA有助于解决在开发易于实现、计算效率高和可解释的去噪方法方面的研究差距似乎是合理的，这些去噪方法是数据效率高的，并且可以保留已识别异常数据的索引，以便在同步的、标记的数据集中使用。

本文利用PPG信号的综合数据集对EPDA的有效性和计算效率进行了介绍和评估。

EPDA是针对PPG信号的去噪而定制的，其中主要应用是从脉冲交流分量中提取时间和形态特征。我们的目标是鼓励PPG数据处理领域的新途径，帮助实现在基于PPG监测的背景下提取更准确和可靠的生理测量。

Method

2.1 Data

本文提出的研究结果基于内部多波长近红外光谱(NIRS)光学传感器产生的数据[14]。核心数据集由31例创伤性脑损伤(TBI)患者的反射率PPG数据组成。

收集数据的目的是探讨颅内压对PPG数据形态学特征的影响。在此背景下，研究重点选择了810 nm波长，因为在810 nm波长处，氧合血红蛋白和脱氧血红蛋白具有相同的吸收特性[15]。这使得提取独立于血氧的光信号成为可能，并消除了它作为混淆因素的影响。随后，本研究重点研究了810 nm波长采集的数据。

传感器被固定在患者额头发际线以下。在数据收集过程中，患者在医院病床上，大多数患者处于镇静状态。患者平均年龄43.92岁，男女比例为13:2。数据采集时间平均为40.55 h (SD 9.63)。数据集的总长度为4.86亿个实例，代表大约81,015.99分钟或1350.27小时。

2.1.1. Manifestation of noise

在数据中，假设存在两个主要的噪声源:(i)运动伪影，通过不规则的信号形态或高振幅方差来识别，以及(ii)光电探测器饱和，其特征是很少或没有振幅方差的区域称为“平坦线”。图2显示了数据集中可疑运动伪影和光电探测器饱和的存在。

2.2. Envelope PPG denoising algorithm

EPDA通过6个步骤进行操作:(i)信号上下包络线的滤波和计算，(ii)包络线差的计算，(iii)阈值的计算，(iv)异常指标的检测，(v)分割点的计算，以及(vi)去除已识别的异常数据。在初始步骤中，将截止频率设置为0.5和12的四阶带通巴特沃斯滤波器应用于从信号中去除不需要的频率成分的数据。一旦数据被过滤，信号的上、下包络线就被计算出来。为了计算包络，使用Scipy的“find peaks”函数检测信号的波峰和波谷[16]。“查找峰值”功能的“距离”输入参数设置为数据窗口总长度的20%，以秒为单位表示。这种距离定义通过减少检测到的波峰和波谷的数量来优化计算效率。因此，在计算包络线时需要更少的插值点，同时保留有效表征信号异常区域的能力。一旦确定了波峰和波谷，就使用线性插值来计算信号的上下包络。由于计算效率高，线性插值比其他方法(如样条插值)更受欢迎。它通过在两个相邻的数据点之间创建一条直线来估计值，捕获点之间的关系，并有效地表示数据的异常部分。包络差是通过取上下包络的绝对差得到的。包络差提供了信号的简化表示，同时保留并强调了有助于噪声表征的幅度的显著变化。
在这里插入图片描述
图3直观地展示了检测到的波峰、波谷、上下包络以及包络差。为了演示EPDA的逐步进展，从图3到图6使用了相同的数据窗口。
EPDA包含两个不同的功能，可以有效地检测不同类型的噪声。一个功能的目标是识别运动伪影，而另一个功能侧重于检测数据中的平坦线段。对于运动伪影检测，EPDA基于数据的四分位数范围动态地建立上下限阈值。阈值是使用方程计算的。(1)、(2)
𝒖𝒑𝒑𝒆𝒓 = 75th 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙𝑒 + (𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑 ∗ 𝑖𝑛𝑡𝑒𝑟𝑞𝑢𝑎𝑟𝑡𝑖𝑙𝑒 𝑟𝑎𝑛𝑔𝑒) (1)
𝒍𝒐𝒘𝒆𝒓 = 25th 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙𝑒 − (𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑 ∗ 𝑖𝑛𝑡𝑒𝑟𝑞𝑢𝑎𝑟𝑡𝑖𝑙𝑒 𝑟𝑎𝑛𝑔𝑒) (2)
IQR对异常值具有鲁棒性，并提供了一种数据传播的度量，与标准差等度量相比，它受极值的影响较小。通过使用IQR，我们确保阈值基于数据的中心50%，使它们对异常值不那么敏感，更能代表典型的数据分布。百分位数的选择，特别是第25(下四分位数)和第75(上四分位数)百分位数的选择，是统计学中常用的方法。这些百分位数将数据分成四分位数，IQR表示中间50%数据的分布。通过将下限阈值设置为第25个百分位数，上限阈值设置为第75个百分位数，我们有效地捕获了大多数观测值预计会下降的数据的中心范围。这确保了我们的阈值是有意义的，并且与大多数数据点相关。通过引入用户定义的阈值乘法器，我们的目标是在异常检测过程中实现灵活性和适应性。通过将IQR与用户自定义的阈值相乘，我们使用户可以根据自己的具体需求调整阈值的严格程度。乘数越高，门槛越严格，乘数越低，门槛越宽松。该参数允许用户微调算法对异常的敏感性。
用户可以定义阈值，默认值为2(在本研究中，所有患者数据均保持默认值2)。当检测平坦线段时，线高阈值和线时间阈值都是自定义的。线高阈值决定了被认为是平坦线所需的最小幅度，而线时间阈值指定了数据必须保持在幅度阈值以下才能被识别为平坦线的持续时间。因此，如果一段数据保持在幅度阈值以下的时间等于或长于时间阈值，则将其识别为一条平线。
在运动伪影检测函数中，计算包络差内发生斜率变化的所有实例。任何坡度变化超过上限或低于下限的数据实例都被视为异常。

伪代码1概述了运动伪影异常检测算法。
在这里插入图片描述
为了提高去噪算法的计算效率，运动伪影检测保证在第一个和最后一个阈值交叉点之间的数据实例不是都被定义为异常。相反，只有在这个范围内发生斜率变化的数据实例才被认为是异常。这种逻辑在计算每个检测到的异常的分割点时最大限度地减少了不必要的迭代，大大减少了计算量算法的开销。图4描述了检测异常的两种方法之间的差异，对于示例数据，两种方法之间的差异为5400%。
在这里插入图片描述
检测数据的平线段的逻辑可以分为两个步骤。第一步涉及应用用户定义的行高度阈值，并将数据表示为0秒和1秒。超过行高阈值的信封差值设置为1。所有小于行高阈值的值都设置为0。这种表示允许简单地描述数据中潜在的平坦线段的起点和终点。一旦数据表示为0秒和1秒，就可以使用伪代码2中描述的算法识别平线段。
在这里插入图片描述
平线检测代码在增强数据中搜索表示平线段可能的起点和终点的1 s。如果起点和终点之间的距离≥用户定义的线时间阈值，则该段被识别为平坦线。平线检测代码的输出是一个索引列表，表示数据中平线段的开始和结束索引。
一旦检测到任何运动伪影和平线段并记录其索引，则为每个识别的异常计算合适的分割点。这些分割点是根据包络差值和包络差值的中位数相交或紧密对齐的指标确定的。一旦这些指标被计算出来，就可以得到每个异常的分割点。分割代码的结果是一个索引列表，表示异常数据的起始点和结束点。在运动伪影检测算法中，关键的一步是只考虑超过阈值的数据实例和作为异常发生斜率变化的指标，这对分割点的计算起着重要的作用。通过只关注斜率变化超过阈值的实例，该算法可以突出潜在的感兴趣区域，这些区域最有可能包含由运动伪影引起的异常。这种方法减少了所需的迭代次数，并消除了对相同识别异常的冗余分割索引的计算。从而大大降低了算法的计算复杂度。该算法可以更有效地处理数据，从而更快地检测到异常。在处理大型数据集、实时处理或资源受限环境时，这种优化非常重要，因为它有助于提高运动伪影检测过程的整体性能。
在去除每个异常计算的分割点之间的索引范围之前，该算法将相邻的距离较近的“分割段”组合在一起，形成更大的分割段。这个过程有两个目的，它:(i)通过最小化需要迭代的分割部分的数量来降低算法的计算复杂性，(ii)在分割部分之间合并潜在的数据实例，这些数据实例可能没有被明确识别为异常，但表现出较差的形态质量。一旦数据的异常区域已被删除，数据被过滤使用低通二阶巴特沃斯滤波器的截止频率为10赫兹。图6为去噪前后的数据。
在这里插入图片描述