一项调查:从浅到深的机器学习方法的血压估计使用生物传感器【翻译】

一项调查:从浅到深的机器学习方法的血压估计使用生物传感器

摘要

在过去的20年里,机器学习系统在医疗保健行业领域迅速发展,如数字健康、健身跟踪、患者监测和疾病诊断。与此同时,随着技术的进步,与人工智能(ai)配对的生理传感器因其多种优点而备受关注。这种传感器主要是廉价、便携、易于使用,可以帮助使用人工智能连续和非侵入性地测量健康参数。PPG (Photoplethysmography)和ECG (Electrocardiography)等技术是两种具有巨大潜力的技术,可以对心血管健康状况产生重大影响。在这篇调查论文中,我们旨在分析、总结和比较基于机器学习的、连续的、无袖带的、无创的PPG生物信号血压估计的最新方法。本调查将研究工作分为两类:浅层学习和深度学习。文中还介绍了PPG特征提取技术和数据集。此外,根据文献对PPG和ECG进行了简明的比较分析。此外,为了比较使用PPG生物信号的不同传统特征提取技术,我们应用了几种机器学习算法来预测高血压和心率估计。最后,我们总结了关键的影响,并提出了一些有前景的前景,将导致该领域的发展。

简介

由于诸如基于人工智能的症状检查(LaFramboise, Woster, Yager, &和药物发现工具(Wallach, Dzamba, &Heifets, 2015)。根据世界卫生组织(世卫组织)的资料,全世界导致死亡最多的疾病是心血管疾病(Mendis, Puska, norving, &组织,2011年)。患上这些疾病的风险与许多因素有关,比如不健康的生活方式、高胆固醇和高血压。因此,早期发现这些疾病有助于降低病情恶化的风险。早期风险指标之一是高血压,它是许多健康问题的主要原因,可以通过血压估计来预测。测量血压的方法有很多种,有创的或无创的。侵入式方法是在重大手术或在重症监护病房(ICU)由训练有素的人使用的方法。这是一个耗时的过程,也有一些健康风险。然而,由于其临床意义,非侵入性方法更受欢迎。无创血压测量技术可分为使用不同医疗器械和技术的不同方法。这些方法大多能准确测量血压,而不会使患者感到不适。

在某些情况下,它需要持续监测患者的心脏相关健康和血压。因此,生物传感器技术的进步以其简单、便携、能连续、无创地测量健康参数等优点引起了人们的关注。像健康追踪设备这样的可穿戴传感器正在受到人们的欢迎,他们可以持续跟踪和记录自己的健康参数,供未来使用。生物传感器,特别是光电容积描记术(PPG)和心电图(ECG),已被广泛研究,并被发现可用于评估心血管疾病(CVD)状况。

生物传感器

**光容积描画(PPG)**是一种无创的光学技术,可用于检测组织微血管床的血容量变化。基本的PPG设备需要一些光电组件:用于照明组织(如人体皮肤)的光源和用于评估与集水池灌注变化相关的轻微光强度变化的光电探测器(JohnAllen, 2007) (Xing & Sun, 2016)。通常用作光源的发光二极管(LED)和光电探测器将光能转换为电能,这可以被记录下来(John Allen, 2007)。PPG有两种不同的设备模式:透射模式和反射模式。光电探测器和LED以传输模式放置在组织的另一侧,光通过它们传输。然而,在反射模式下(见图1),LED和光电探测器安装在组织的同一侧,可以通过后向散射光记录信号(Tamura, Maeda, Sekine, & Yoshida, 2014)。

记录的PPG信号由两部分组成:直流电(DC)和交流电(AC) (Caizzone, Boukhayma, &劳动部,2019)。交流组件是基于脉冲的,因此与脉冲相同的频率变化。它决定血液灌注,因为它直接与搏动的血液相连(John Allen, 2007)。直流电是准常数,被称为非脉动,指的是皮肤组织和平均血容量。在心动周期中,DC分量的血容量不发生变化(John Allen, 2007)。因此,交流部分只占直流部分的一小部分(通常低于10%),这取决于皮肤颜色和身体位置(Webster, 1997)。此外,DC成分可受呼吸、血管舒缩活动、自主神经激活、traube - herin - mayer波、低血容量和体温调节(Grote &邹,2017)。小的AC/DC比值被称为灌注指数(PI) (Caizzone等人,2019)。PPG波形信号通过归一化线性缩放,该归一化取AC/DC (Xing &太阳,2016)。图1显示了通过带有LED和光电探测器的PPG器件的反射模式获得的PPG波形的交流和直流映射。

Aoyagi(2003)和Yoshiya, Shimada, and Tanaka(1980)提出的现代PPG假设动脉血容量的变化与PPG信号的变化相关。PPG传感器技术被集成到一个小型可穿戴设备中,用于测量脉搏率和氧饱和度,主要放在手指、耳垂上,很少放在鼻子或脚趾上。最近,基于机器学习的、连续的、无袖带的、无创的PPG生物信号血压估计受到了相当大的关注(Marzorati, Bovio, Salito, Mainardi, &Cerveri, 2020) (S ENTÜRK等人,2019)(Senturk, Polat, &(Mohebbian, Dinh, Wahid, &Alam, 2020) (S entürk, Yücedag, &Polat, 2018)。

**心电图(ECG)**记录心脏的电活动,并提供心率和心率的信息。在临床试验中,这是一种非常有效的检测心脏疾病的方法。它可以通过放置电极(贴在病人皮肤上的小塑料片)来记录,电极通过导线连接到机器(ECG)上。图2显示了一个典型的心电图信号波形,包括P波、QRS波和T波(Poungponsri &余,2013)。连续心电监测可提供心血管相关疾病的早期检测,可通过穿戴式心电监测穿戴式应用实现(Ramasamy &巴兰,2018)。PPG和ECG技术都可以测量心率和不同的心血管相关信息。

在这里插入图片描述

图1所示。PPG的测量由传感器设置和交流、直流分量组成PPG信号。

在这里插入图片描述

图2所示。一个典型的心电图信号波形。

特征工程

许多研究者正在从PPG信号中寻找越来越多的特征信息,以获得可靠的医学评估结果。许多PPG信号特征提取技术已经被研究,并在使用它们的方法上有了显著的改进。常用的血压(血压)估计技术有脉搏波速度(PWV)、脉搏到达时间(PAT)和脉搏传递时间(PTT) (Nye等人,2015)(Seo, Pietrangelo, Lee, &Sodini, 2015) (Goli &Jayanthi, 2014)。表1提供了现有特性工程技术的总结。

脉搏分析:这些特征可以从PPG信号波形的特定特征中提取,如宽度、高度和其他测量值。一些研究调查了使用单一PPG传感器而不使用袖带的血压预测的实用性(Teng & Zhang, 2003) (S. Suzuki & Oguri, 2009) (Lamonaca et al., 2013)。这种方法是有前途和吸引力的,因为它提供了一个直接和准确的血压估计。Teng和Zhang(2003)利用脉搏波分析技术,从PPG波形中提取宽度为1/2、脉幅宽度与收缩期上冲时间的比值为2/3、舒张期的比值为4个特征来测量血压。从PPG信号波PW, TW, Dn, DW (S. Suzuki & Oguri, 2009)也计算了其他特征。此外,A. Suzuki和Ryu(2013)计算了7个信噪比(SNR)特征,用于估计收缩压。随后,作者(Mohamad Kachuee, Kiani, Mohammadzade, & Shabany, 2015)提出了PPG特征来估计无校准的血压估计。这些特征是增强指数(AI)、大动脉刚度指数(LASI)和拐点面积比(IPA)。在另一项研究中,Fujita、Suzuki和Ryu(2019)计算了PPG波形的二阶导数,并将其作为特征。Lamonaca等人(2013)提出了一项研究,将智能手机摄像头的血压估计作为摄像头帧序列的PPG信号提取器;提取PPG信号后,通过波形分析进行特征提取。提取的特征包括舒张时间(DT)、上搏时间(SUT)、心脏周期(CP)、收缩期宽度(SW)、舒张期宽度(DW)和宽度比DW/SW(波形宽度分别为PPG脉冲振幅的33%、50%、66%、75%)。

生理参数与PPG不同点与心电信号之间的时间间隔以及PPG信号波形有关。图3可以被视为下面将进一步讨论的信号波特征的一个示例。

在这里插入图片描述

图3所示。PPG信号的波形特征。

  • 心率:可以通过心电图或PPG信号峰值与峰值之间的时间间隔来计算。
  • 拐点面积比(IPA):可以通过PPG曲线面积的点S1、S2、S3和S4来计算。
  • 大动脉刚度指数(LASI):这是一种动脉刚度指标,与拐点和收缩峰值时间间隔呈负相关。
  • 增强指数(AI):这可以通过计算拐点和收缩峰值的比值来计算。 A I = x / y AI = x / y AI=x/y
  • 脉冲传输时间(PTT):是压力波在两个动脉位置之间传播所需的时间(Bramwell &希尔,1922)(尼科尔斯,奥·洛克,&肯尼,1991)。这是一种非侵入性的方法,可以显示动脉位置的两个点之间的时间,一个点可以从ECG中获取,另一个点可以从PPG中获取。此外,我们还可以利用两个PPG传感器来估计PTT。我们最常见的可以放置这些传感器来测量PTT的身体部位是耳朵、手指和脚趾(J Allen &穆雷,2002)。基于PTT技术的血压估计需要三个步骤:首先,需要两个传感器;其次是PTT参数的计算,最后是校准(El Hajj &Kyriacou, 2020)。因此,在使用PTT方法估计血压时,有几个明显的缺点。基于PTT的技术估计需要两个传感器,也需要对两个信号波形进行信号处理,以去除运动伪影。此外,这种方法需要校准,因为它取决于个体的生理参数(Mukkamala等人,2015)。除此之外,PTT与血压呈反比关系(El Hajj &Kyriacou, 2020)。
  • 脉搏到达时间:这可以通过心脏电激活和脉搏波到达身体特定位置之间的时间间隔来测量。或者,PAT等于PTT以及机电心室延迟和等容收缩期的总和,通常被称为射血前期(Mukkamala et al., 2015)。采用PPG和ECG两种不同的传感器测量PAT参数,估计PPG上升边缘点和ECG信号Rpeak的时间差。这种技术的缺点与PTT一节中提到的相同。例如,两种传感器都需要信号处理来去除运动伪影,还需要单独校准。PAT参数计算如图4所示:ECG的PPG峰最大值点(PATp)、PPG波形斜率点(PATd)、PPG最小阈值点(PATf)和r峰。

图4所示。心电图和PPG的PAT特征。

在这里插入图片描述

  • 脉冲波速度(Pulse Wave Velocity, PWV):根据弹性管道中流体的波传播理论,显示压力波在血管中传播的速度。这项技术背后的原因是,血压可以通过心跳的脉搏速度计算出来。心脏搏动开始,血液在舒张期和收缩期分别通过扩张和收缩由中央动脉扩散到较小的远端动脉(Wagenseil &Mecham, 2012)。这种影响引起壁血管弹性的变化,并极大地影响压力脉冲速度。动脉的弹性决定了脉搏波的速度(Sharma et al., 2017)。MoensKortweg方程可以说明这种关系(McCombie, Reisner, &浅田和另外,2006)。PWV可以由位于同一动脉分支上的两个距离已知的PPG传感器测量,通过将两个参考点之间的动脉长度(D)除以脉冲传输时间(PTT)来计算,公式如下所示

P W V = D P T T PWV=\frac{D}{PTT} PWV=PTTD
由于计算PWV时遇到各种挑战,这种方法并不容易。两个传感器测量是必要的。此外,动脉的弹性因年龄、饮食等而因人而异。上述等式所需的动脉长度也因人而异。因此,由于人们的各种生理参数,它需要定期校准(Mohamad Kachuee等人,2015)。因此,PWV不是袖带式血压装置的方便或合适的替代品。

  • 2元windksel模型:该模型将人类心血管系统描述为一个电路(Westerhof, Lankhaar, &Westerhof, 2009)。它提出了一个数学估计,可以联系到血压和血液在动脉流动。Choudhury, Banerjee, Sinha和Kundu(2014)使用2-Element Windkessel模型来估计血压。然而,Windkessel 2元模型没有使用许多影响人体血压的内部参数。因此,该模型简化了心血管系统(CVS);但是,它无法更好地理解CVS这样的复杂系统。
  • 时域和频域特征:利用特定的ECG和PPG信号在时域和频域特征可以估计血压。(Senturk et al., 2020)使用心率变异性、峰度、方差、偏度、均值、均方根和峰值因子作为时域特征。此外,他们通过从ECG和PPG信号的频域提取均值、中值和频带功率属性来提取频域特征。
  • 混沌特征:为了更好地解释时间序列信号,我们使用了一个复杂的特征。诸如多维度或将信号分成相同长度的特征可以用来识别信号。Senturk等人(2020)利用Higuchi (Doyle, Dugan, Humphries, &牛顿,2004)和卡茨(Goh, hamadicharref, Henderson, &Ifeachor, 2005)。此外,基于PPG信号的非线性,不同个体的PPG信号长度也不同。Senturk等人(2020)使用熵作为另一种混沌特征提取技术来检测PPG和ECG信号的不规则性。
  • 分形维数:用不同的方法将信号分成不同的大小,将维数相减。Higuchi分形维数(Doyle et al., 2004)参数可以计算为
  • 通过为 m = 1 , . . . m = 1,... m=1,...创建新的时间序列 X k X_{k} Xk,该方法可以在若干k个子序列中使用不同的分辨率,

在这里插入图片描述

曲线 X k m X_{k}^{m} Xkm的长度 l ( k ) l (k) l(k)计算如下:

在这里插入图片描述

每个k(范围:1到 k m a x k_{max} kmax)的平均长度作为k个长度的平均值计算。

  • Katz分形维数(Goh et al., 2005)算法可以直接从时间序列中得到

在这里插入图片描述

其中d表示第一个点与另一个点之间的欧氏距离,表示与第一个点相关的进一步距离,L表示ECG或PPG的总长度。其中,a表示级数的平均步数。

  • :由于血压是一个复杂的非线性信号,因此很难预测。熵使复杂的信号更容易分析。通过获取复数,可以获得大量的数据。熵可以测量复杂的医疗信号(周,宗夏,春兰,&黄,2017)。可以计算这些信号的香农熵、近似熵和排列熵(Senturk et al., 2020)。对于i = 1, N- 1的信号X的简单熵如下所示

在这里插入图片描述

表1本文讨论的特征工程技术概述。

在这里插入图片描述

基于机器学习的PPG生物信号血压估计

机器学习是人工智能和数据科学的核心,是当今发展最快的技术领域之一,将计算机科学和统计学联系起来(Mohawesh等人,2021年)。在科学、技术和商业领域,可以采用数据密集型学习方法,从而在生活的许多方面,包括卫生、生产、教育、金融建模、警务和营销方面,做出更多基于证据的决策(Jordan &米切尔,2015)。机器学习,配合生物传感器技术,已经在这一研究领域吸引了许多研究人员的考虑(toore等人,2019年)(Panicker &Gayathri, 2019)。例如,许多机器学习技术已经被应用于从生物信号分析中确定血压(Shobitha, Amita, Krupa, &大麻,2017)。在本节中,我们讨论了基于机器学习的PPG信号的血压估计。

浅层次机器学习技术

浅层学习模型允许人工提取特征,它们以提高精度加快了这一研究领域。第一步是对浅层训练模型的原始输入信号进行预处理,通常需要对信号进行去噪处理,然后进行归一化和特征提取。最后,根据选定的特征,将表示好的输入信号送入分类器。在本节中,我们将介绍基于机器学习的估计血压的浅层方法和模型。除此之外,我们还组织了表2中的工作,以便对这一类别给出一个明确的概览。

基于线性回归方法

线性回归(LR)是最广泛使用的机器学习算法之一,用于研究使用方程(Montgomery, Peck, &蔓生,2012)。本节讨论线性回归(LR)、最小二乘回归、多元回归、套索回归和逐步线性回归的相关工作。Teng和Zhang(2003)提出了一项利用PPG连续无创测量动脉血压的研究。数据采集自15名(24 - 30岁)健康人,三种不同的身体状态:1)休息,2)运动(爬台阶),3)运动后恢复。结果表明,舒张压与收缩压有较强的相关性。他们提取了4个PPG特征、2/3脉宽、1/2脉幅、舒张时间和收缩期上搏时间。本研究数据集较小,不能与医疗器械先进协会(AAMI)器械标准(2004)进行比较,因为需要85名受试者来比较结果与参考值。进一步,对平均相关系数最大的特征进行回归分析,用于血压的测量。结果表明:收缩压和舒张压的平均误差和标准偏差分别为 0.68 ± 7.52 0.68\pm 7.52 0.68±7.52 mmHg和 0.09 ± 4.47 0.09\pm 4.47 0.09±4.47 mmHg。

在另一项研究中,Hassan, Mashor, Nasir和Mohamed(2008)提出使用脉搏波传递时间(PWTT)连续测量血压,PWTT是动脉脉压波在外周部位和主动脉瓣之间传递所花费的时间。血压的快速升高导致血管张力升高和动脉壁变硬,从而导致PWTT缩短。人们普遍认为,PWTT的变化表明血压的变化,可以用于连续的无袖带血压评估(Pollak &抱有,1983)。一般来说,PWTT是心电Rwave与外周脉冲(Chan, Hung, &张,2001)。本研究记录了10名健康受试者30 s的心电图和PPG信号。根据这些信号计算出脉冲波通过时间。除此之外,还使用了一个标准的血压计来比较血压记录以进行验证。数据收集包括三个阶段:锻炼、恢复和休息,10名健康参与者。然而,这项研究评估了10个男性个体的小数据集。

Wong, Poon和Zhang(2009)对14名受试者在运动前、运动后1和运动后2不同的身体状态下,使用PTT测量血压。外周压力脉冲的标准选择之一是光电容积描记(PPG)。并计算心电图与外周脉压特征点之间的PTT值。在本研究中,两个实验间隔6个月,使用相同的模型系数。第一个实验在6个月后使用相同系数的最小二乘法来估计血压。结果显示,第一次和第二次运动后,PTT下降,动脉血压明显升高,收缩压与PTT有高度相关性。当使用第一个回归系数进行预测时,收缩期和舒张期bp的计算误差分别增加到 1.4 ± 10.2 1.4\pm 10.2 1.4±10.2 mmHg和 2.1 ± 7.3 2.1\pm 7.3 2.1±7.3 mmHg。这是第一项研究,在第二项实验测试中比较半年后的回归系数。结果表明:各试验的回归系数基本一致。因此,当第一项研究预测动脉血压时,重复性试验的估计差距非常大。采用基于PTT的血压估计算法对潜在基线进行监测,可能会提高估计的精度。

a . Suzuki和Ryu(2013)提出了一种利用Taguchi方法选择PPG信号特征来测量收缩压的技术,该方法实现了信噪比(SNR)。这些特征仅使用一个PPG设备提取。尽管如此,这些特征很容易受到噪声来源的影响,包括由年龄和性别因素引起的人类变异。因此,为了准确测量血压,必须有可靠的特征来对抗这些噪声。在此分析中,采用正交阵列和田口信噪比方法选择对噪声有效的多元回归分析。结果表明,数据集1和数据集2的估算值与实际值的相关系数分别为0.88和0.87。该方法确定了收缩压估计的重要结果。Choudhury等人(2014)提出了一种PPG使用昆士兰大学生命体征数据集测量血压的无创技术(D. Liu, Gorges, & Jenkins, 2012)。该方法首先映射出与某些个体特定隐藏参数相关的PPG特征;然后计算血压值,而不是直接从PPG特征计算收缩压和舒张压。为此,2元Windkessel模型被用来估计动脉顺应性和总外周阻力个体PPG特征。该模型将人类心血管系统表示为一个电路,可以用数学方法将动脉中的血流和血压联系起来(Westerhof等人,2009)。然后用线性回归法模拟动脉血压。实验结果显示收缩压和舒张压值的绝对误差分别为0.78 13.1 mmHg和0.59 10.23 mmHg。这些结果还表明,该方法比传统的PPG明确估计血压的技术更稳健。

Shen, Miao,孟,Li(2015)提出了一种基于多参数的血压连续测量方法。在本研究中,10名受试者参与了PPG和ECG信号的数据采集和血压测量。他们提取5个PPG和ECG参数,计算收缩压、舒张压和MAP值。本文提出了一种多参数连续估计血压的方法。从PPG和ECG中提取5个参数,用于拟合收缩压(收缩压)、舒张压(舒张压)和平均动脉压(MAP)的值。特征选择:利用MATLAB计算PPG峰值、ECG峰值、波底峰值、PWTT峰值、ecgPeriod峰值、ppgSystolicTime峰值、PPG - k峰值、ppgDiastolicTime峰值。采用逐步回归的方法,利用3个不同的方程估计血压值,并在另一个数据集上进一步验证。结果表明,平均误差小于6 mmHg,标准偏差误差小于6.5 mmHg。结果表明,该方法在预测血压方面具有一定的准确性。

Datta、Banerjee、Choudhury、Sinha和Pal(2016)进行了另一项研究,通过使用2元Windkessel模型改进现有方法,实现无创血压测量。在这项研究中,PPG信号是通过指尖脉搏血氧仪从个人的两个位置采集的。在此基础上,采用背线校正、滤波等信号噪声清洗方法,利用最大信息系数评分提取PPG的相关特征。利用线性回归模型,利用潜参数测量血压。研究结果显示,市面上用于测量血压的参考数字设备的误差率在10%以内。作者提出改进现有的基于噪声PPG信号的血压估计模型的性能。但是,需要改进错误缓解模型。Ghosh等人(2016)提出了另一项无创、连续的血压估计研究,使用脉冲传输时间(Pulse Transit Time, PTT),可以从ECG和PPG信号计算。这项研究对14名参与者进行了研究,并使用了5种不同的姿势(步行、骑车、站立、坐着、躺着),同时记录信号。进一步,用线性回归模型估计血压。本研究表明,实验和手工PTT测量的差异仅为1%。参考血压是由一个标准的示波器袖口装置导出的。在静止的身体状态下,准确率很高,但在其他姿势下则不然,因为走路或骑自行车会产生更多的生物信号噪音。

Hsieh, Wu, Lu, and Tsao(2016)提出了一种基于人工线性回归模型的脉搏传递时间(PTT)测量血压的方法。该模型利用静态和动态的PTT特征来准确测量血压。结果表明,该模型优于传统方法,为舒张压预测提供了有价值的信息。他们使用数学符号计算动态PTT,使用收缩压值计算舒张压预测。研究表明,静态和动态PTT特征对正常人和高血压患者的血压预测精度较好。本研究也有助于利用收缩压估计值预测舒张压。Dey, Gaurav和Tiwari(2018)基于频域和时域特征提出了一套新的PPG特征。这种新的血压测量模型基于生理和人口统计学划分。作者认为,本研究通过开发心脏血压测量系统,为心脏健康管理技术的发展迈出了重要的一步。他们提出了一个为智能手机部署的移动应用Insta血压。然而,这个移动应用程序现在还不能使用,并且已经停止。此外,本研究也不符合AAMI标准。

Fujita等人(2019)提出了一种利用偏最小二乘回归(PLS)测量收缩期血压的方法。本研究采用水平交叉特征(LCS)来避免基于脉冲波峰的特征。这些特征来自于PPG (SDPPG)波形的二阶导数,轮廓线从100%到100%的振幅间隔5%提取(Nakaya, Ue, Suzuki, &Ryu, 2016)。收集了265名受试者的数据以测量收缩压,并计算了每个人5919个脉冲20 s信号测量的SDPPG。此外,他们进行了Bland-Altman (BA)分析(Bland and Altman 1999),以确定所提出的模型的系统误差。该方法的结果显示,收缩压的平均值和标准差为133.1 18.4 mmHg。

回归树方法

采用三种不同的机器学习技术来预测收缩压和舒张压,并比较了技术的准确性(Khalid, Zhang, Chen, &郑,2018)。得到的PPG特征为脉冲面积、25%宽度和脉冲上升时间。采用在线数据集(The University of Queensland vital sign)获取PPG信号及其参考血压,并从PPG信号中确定三个最基本的特征,对三个机器学习模型进行训练。采用10倍交叉验证法获得血压估计的准确性。这种准确性被进一步分为三类:高血压、低血压和正常血压。回归树的表现优于三种机器学习技术,并符合国际标准化组织(ISO)关于正常血压类别的收缩压和舒张压的标准,分别为 1.1 ± 5.7 1.1 \pm 5.7 1.1±5.7 mmHg和 0.03 ± 5.6 0.03 \pm 5.6 0.03±5.6 mmHg。另外两种机器学习技术,多层感知器(MLR)和支持向量机(SVM),对于任何一个血压类别都不能得到令人满意的结果。

B. Zhang, Wei, Ren, Cheng, and Zheng(2018)提出了用于测量血压的分类回归树(cart)模型。该模型进行了交叉验证,以实现推广。本研究的结果优于其他四种机器学习算法:支持向量机、脊回归、线性回归和神经网络。该模型是一种监督机器学习模型,利用右心房(AVR)、左心房(AVL)、前心房(AVF)、PPG、心率(HR)、脉搏波平移时间(PTT)和氧饱和度等生物属性预测Ps和Pd。本研究得出结论,PTT和HR是计算血压最显著的两个特征。

KNN方法

Yi、Jian和Wenqiang(2019)提出了一种基于不同机器学习算法和PPG信号的高精度、连续的动脉血压估计方法。他们已经从mimicii数据库获得了超过5000个信号。然后从每个PPG周期信号中选择9个形态特征。他们采用了五种机器学习算法:线性回归、LASSO、弹性网络、KNN和CART。并对各算法的性能进行了比较,结果表明KNN算法的精度最高。他们还表示,血压(血压)对预防心血管疾病(CVD)有显著作用,因此是健康系统的基本生理指标。最后,他们提出,较少的PPG特征可以达到与之前提出的使用更多特征来估计血压的其他方法相同的精度。

DT方法

Mousavi等人(2019)介绍了一种针对不合适PPG信号的方法,该方法使用MIMIC II数据集进行基于整体的特征提取。在这项工作中,他们使用FFT滤波器对PPG信号进行降噪。然后,他们应用特征提取技术,并将其细分为进一步的步骤。对于血压估计,已经使用了几种机器学习技术,它们是:支持向量回归、决策树回归、随机森林和自适应增强回归。该方法声称是无校准的,无创的,连续的。本研究结果符合AAMI标准的舒张压和MAP;然而,收缩压接近标准,但不合规。作者提到,mimat数据集取自重症监护病房患者,因此使用健康受试者数据可以提高准确性。

SV方法

无袖式血压监测仅使用PPG传感器进行特征调查(Duan, Qian, Atef, &王,2016)。采用了多种技术来检测PPG信号的更多特征。该方法在昆士兰大学生命体征数据集上提取了57个特征,并对其进行了评估。首先,应用平均滤波器和小波变换去除噪声(如运动伪影、呼吸)。然后,采用一种标准化程序来处理环境因素(如传感器灵敏度、测量位置或皮肤温度)引起的不同PPG振幅变化。

在这里插入图片描述

上式中,PPG0为PPG的实际振幅序列,PPGn为PPG归一化的信号拍。在正常化之后,这些信号被分成每组10拍的短期帧。他们探索了57个特征,然后使用三组11个选定的特征使用支持向量机预测MAP、收缩压和舒张压。PPG特征包括面积、脉冲宽度、角度、振幅和非线性组合,并引入了新的特征,如归一化PPG的主峰平均面积的近似内角。该研究对32例患者的数据集,收缩压、舒张压和M血压的准确性分别为 4.77 ± 7.68 4.77 \pm 7.68 4.77±7.68 3.67 ± 5.69 3.67\pm 5.69 3.67±5.69 3.85 ± 5.87 3.85\pm 5.87 3.85±5.87 mmHg。此外,该方法采用轻量级特征,满足AAMI和BHS(英国高血压学会)标准。然而,该方法采用支持向量机作为血压估计方法,由于不能提供调节动脉压所需的前事件反馈,因此不适合长期的血压测量(El-Hajj &Kyriacou, 2020)。

Gao, Wittek, Zhao和Jiang(2016)介绍了一种数据驱动的方法,使用一次PPG信号的光记录来测量收缩压和舒张压。这项研究对65名没有心脏相关问题的受试者进行了检查,PPG信号来自智能手机摄像头和脉搏血氧仪。该方法结合了监督学习和离散小波变换。为了收集数据,申请人被要求用左手握着手机,并将食指放在手机摄像头上。使用定制开发的移动应用程序,从摄像头和脉搏血氧仪同时记录120秒(约两分钟)的数据。香农小波被用作周期特征的离散小波变换(DWT),因为它是有效的。此外,利用墨西哥帽母小波提取最优特征与收缩期上stroke和舒张期脉搏时间(Teng & Zhang, 2003)。其他特征包括PPG的振幅和归一化谐波面积(Yan & Zhang, 2006)。此外,他们还使用了舒张期上卒中时间、收缩期上卒中时间、年龄、性别以及DWT系数。之后,他们使用线性支持向量机进行特征选择,并使用前向特征选择技术,即当基于预测的备选特征没有提高所选特征子集的优点时,停止添加更多特征,并使用应用网格搜索的参数调整学习器。在这些特征中,只有十几个DWT系数通过使用线性预测器提供了有效的精度。相关特征来自于不到1%的时频分解。这一发现暗示了大多数信号信息是无关的,不需要测量收缩压和舒张压。这项研究也证实了血压和心率并不是直接相关的(W. ChenKobayashi, Ichikawa, Takeuchi, & Togawa, 2000)。PPG信号的记录对噪声不敏感,大多数人已经有了记录PPG信号的设备。手机摄像头测PPG和脉搏血氧仪测PPG的平均错误率是平行的。收缩压和舒张压的平均误差分别为5.1 4.3 mm Hg和4.6 4.3 mm Hg,均在AAMI标准范围内。

Shobitha等人(2017)进行了一项使用PPG无创测量血压的研究。在这项工作中,他们使用了从26名受试者在三种不同的放松、运动和休息状态下的156个PPG信号中提取的特征来预测舒张压和收缩压。使用一种监督机器学习技术——相关向量机(RVM)来估计收缩压和舒张压。此外,采用随机森林(RF)和支持向量机(SVM)两种机器学习技术对收缩压和舒张压进行了预测和验证。研究结果表明,与其他两种方法相比,相关向量机的性能较好。然而,本研究使用的数据集很小,没有预期平均误差,以AAMI和BHS标准进行分析。

Miao等人(2017)通过结合机制驱动模型和数据挖掘两种技术进行了一项测量连续血压的研究。采集心电图和PPG信号数据,提取其他14个特征。采用轮盘选择法作为遗传算法,选择出最适合每个被试的特征。血压模型采用支持向量回归(SVR)和多元线性回归(MLR)。静态血压估计具有良好的准确性,73名受试者的平均误差为0.852,收缩压为 0.001 ± 3.102 0.001\pm 3.102 0.001±3.102 mmHg,舒张压为 0.004 ± 2.199 0.004\pm 2.199 0.004±2.199 mmHg。该模型进一步与Ding, Zhang, Liu, Dai和Tsang(2015)提出的用于血压估计的脉冲传输时间(PTT)和光体积脉搏图强度比(PIR)进行了比较。该方法在标准偏差(SD)和平均绝对差(MAD)方面优于文献中基于PTT的血压估计技术,约为2 mmHg。结果表明,PIR和PTT可以用所提出的血压模型测量连续血压值,并且具有较好的精度。然而,该方法使用两个不同位置的传感器来获取PPG和ECG信号数据。

利用mimiii数据集和PPG (M. Liu, Po, &傅,2017)。他们提取了21个时间尺度的PPG特征,这是Kurylyak, Lamonaca和Grimaldi(2013)提出的,另外14个特征来自PPG的二阶导数(SDPPG)。先前的研究表明,SDPPG可以发现主动脉僵硬和顺应性,并与血压有深度关联(Bortolotto, Blacher, Kondo, Takazawa, &(Takazawa et al., 1998)。此外,为了提高PPG信号测量血压的精度,提出了周期筛选方法,以确保周期为W形。机器学习技术,支持向量回归(SVR),被用来估计血压。研究结果表明,基于组合特征的血压估计方法能使基于PPG的传统时间尺度特征的血压估计精度提高40%。陈s ., Ji, Wu和Xu(2019)介绍了一种利用MIMIC II数据集从PPG信号中测量舒张压和收缩压的技术,提取了包括PTT (Pulse Transit Time)、脉搏波形特征和心率(HR)在内的14个特征。为避免特征冗余,提高算法的有效性,采用均值影响值(Mean Impact Value, MIV)方法。采用反映进化过程的计算模型——遗传算法(Genetic algorithm, GA)进行参数优化。所有方法均采用支持向量回归测量血压。该方法的效果较好,但存在一些不足,如不知道所提出的模型用于长期血压监测的准确性。

B. Zhang, Ren, Huang, Cheng, and Hu(2019)使用支持向量算法从生理参数预测血压。主要贡献是研究支持向量回归算法与医疗器械记录的血压估计数据的结合,以实现准确的预测模型和人体生理参数之间的隐式联系。在本研究中,18名年龄在18 - 50岁之间的健康受试者参与了研究,他们没有任何身体状况,在记录数据之前遵循了一些预先设定的协议。从PPG和ECG生物信号中提取PTT、PPG、HR、SpO2和AVF等特征。该监督学习算法对Pd的预测准确率为97.71%,平均准确率为98.43%。并将该模型与神经网络模型和线性回归模型进行了比较,结果表明该模型具有较好的效果。

集成方法

集成算法的目的是收集多个算法的结果,以便更好地解释和性能(Li, Peng, Li, Xia, Yang, Sun, Yu, &他,2020)。传统的集成算法采用boosting技术来提高预测模型的精度。这些算法是AdaBoost (Freund &Schapire, 1997), bootstrap聚合,随机森林(RF) (Liaw &Wiener, 2002)和XGBoost (T. Chen &Guestrin, 2016)。Monte-Moreno(2011)提出了一种利用机器学习技术和PPG无创测量血糖和血压的方法。该系统的结构包括一个活动检测模块、一个PPG传感器、一个可以提取PPG波形属性的信号处理模块以及一个用于估计收缩压、舒张压和BGL的机器学习方法。该方法的概念是PPG波形与血糖水平和血压之间的函数关系。本研究提出的机器学习方法有随机森林、支持向量机、多层感知器神经网络和脊线性回归。410名受试者参与了实验。随机森林模型的结果最可靠,收缩压、舒张压和BGL的决定系数分别为R = 0.91、R = 0.89和R = 0.90。临床应用符合英国高血压学会血压B级标准。该方法不能连续测量血压值;然而,它可以测量24小时,也没有与有创测量作为参考方法进行比较。

Mohammad Kachuee, Kiani, Mohammadzade和Shabany(2016)提出了基于脉冲到达时间(PAT)的无袖测量血压。文献表明,最常用的血压估计方法是脉搏波速度(PWV) (Peter, Noury, &赛尔尼,2014)。但是,这项技术取决于每个人的生理参数,需要校准。这就是为什么它不能被医疗标准批准测量血压,因为校准。Mohammad Kachuee等人(2016)提出了一种框架,通过提取两类特征来测量血压值,这些特征要么基于整体表征,要么基于信号的生理参数。首先对ECG和PPG信号进行降噪处理,然后计算信息特征,作为回归模型的输入,计算血压值。本研究使用ECG和PPG信号作为近端和远端参照,利用MIMIC II数据库测量PAT (PTT)。对于监督学习,使用动脉血压(A血压)信号来获得收缩压和舒张压的近似。最小、最大A血压信号值与舒张压、收缩压相同。四种机器学习算法被用于回归目的。这些研究结果根据英国高血压协会(BHS)和医疗器械先进协会(AAMI)标准进行评估。该方法不符合收缩压的AAMI标准,但符合舒张压和MAP结果标准。舒张压按BHS评定为A级,MAP评定为B级。由于收缩压不是按照标准来完成的,因此使用这种连续的血压测量技术是具有挑战性的。

作者(R. He等人,2016)提出了一种机器学习技术——随机森林,以研究PPG、ECG信号和动态血压(A血压)之间的关联。本研究利用icu多参数智能监测(MIMIC II)数据库,利用PPG和心电信号提取18个特征。与标准脉冲渡越时间法相比,随机森林法具有较好的性能。但是,随机森林模型比线性回归模型速度慢,训练时间长。此外,他们建议在健康人身上测试这种方法,而不是在重症监护病房的病人身上。铃木(S. Suzuki)和小uri(2009)引入了一种采用PPG和模式识别技术的无创、无袖扣的收缩压测量方法。本研究在纠错输出编码技术的基础上,采用多分类器(Adaboost)算法。用脉搏波分析了368名参与者的几个特征,并计算了收缩压。计算收缩压,SD = 11.7 mmHg, MD = -1.2 mmHg。因此,这项技术可以通过改进来帮助监测连续的血压。然而,这种方法只能提供收缩压测量,不满足AAMI标准(El-Hajj & Kyriacou, 2020)。此外,该方法不能连续测量血压值。

总结

浅层机器学习方法从包含重要预定义特征的数据中获得预测值。然而,特征提取和选择是具有挑战性的任务,需要积累知识,以从原始数据集提取特征。因此,与深度学习模型相比,这些模型具有更好的计算复杂度。在这一领域的研究中,大部分工作是使用浅层学习方法完成的,表2总结了使用人工智能估计血压。

表2通过以下浅层次机器学习技术总结相关工作。

在这里插入图片描述

深度机器学习技术

深度神经网络(DNNs)由人工神经网络组成,模仿人类大脑从数据中自动学习,在图像处理方面取得比浅层学习模型更好的结果(Razzak, Naz, &Zaib, 2018),语音识别(Deng, Hinton, &金斯伯里,2013),语言翻译(Dong, Wu, He, Yu, &王,2015)。根据数据集的特点,将输入词向量分配给dnn模型进行训练,直到达到终止条件。在本节中,我们将介绍一些根据PPG生物信号估算血压的DNN,包括DNN技术,它们各自具有准确性和重大发现。

基于回归神经网络(RNN)的方法

Sideris、Kalantarian、Nemati和Sarrafzadeh(2016)提出了一种方法,通过具有动态和时间行为的脉搏血氧仪设备,使用PPG连续测量动脉血压。为了验证,我们从重症监护病房(ICU) MIMIC数据库中收集了200例患者的数据。数据库中选取的数据包括指尖PPG信号和有创A血压,本研究采用深度神经网络对血压进行估计。这些神经网络已经成功地实现,并在语音识别方面取得了显著的成果(Sak, Senior, &Beaufays, 2014)和笔迹(Graves et al., 2008)。长短时记忆(LSTM)Schmidhuber, 1997)被用于这项研究,因为它具有学习长期依赖的能力。他们针对每个人的数据训练了一个循环神经网络,以获得高质量的结果。这项研究声称,一种强大的远程健康监测系统的方法,不需要传统的血压方法。结果显示,收缩压的均方根误差为2.58 1.23,A血压为6.042 3.26。

S entürk等人(2018)提出了一种使用MIMIC II数据集收集PPG和ECG信号的无校准血压估计方法。他们提出了这项研究的两个阶段;首先,从这些生物信号中获得22个时域特征。在第二阶段,将特征作为RNN模型的输入来估计血压。利用双向LSTM和ReLU (corrected - linear unit)层来处理消失梯度问题。该模型取得了较好的结果,与文献研究结果具有可比性。另一项研究利用LSTM网络使用ECG和PPG信号测量血压(Su et al., 2018)。他们使用现有的血压估计方法,通过明确建模时间依赖性来绘制输入生理信号输出血压值。因此,一个模型不可能在该期间产生良好的精度。在这项研究中,他们提出了一种使用深度RNN(递归神经网络)的序列预测模型,并在各种实验研究中取得了显著的性能(Graves, Mohamed, &Hinton, 2013) (Amodei等人,2016)。然而,由于消失梯度问题,全深度网络可能会变得复杂和具有挑战性的训练(Pascanu, Mikolov, &Bengio, 2013)。该模型由双向结构的多层LSTM网络和用作跳跃连接的剩余连接组成,以提高传播效率(He, Zhang, Ren, &Sun, 2016) (Srivastava, Greff, &(Wu, Schuster, Chen, Le, Norouzi, Macherey, Krikun, Cao, Gao, &Macherey, 2016)。该技术使用静态和多天连续血压数据集实现RNN模型,收缩压和舒张压的RMSE分别为3.90和2.66 mmHg。与以往的所有研究相比,该方法被证明能够给出最好的结果。

Senturk, Polat和Yucedag(2019)提出了一种基于PPG信号特征的基于LSTM和PCA的血压估计新技术。本研究从原始PPG信号中提取了12个时域特征。此外,从主成分分析(PCA)中提取了10个特征,并应用于原始PPG信号。将两组特征结合,利用长短时记忆神经网络(LSTM-NN)模型制作22个特征用于血压估计。结果表明,所引入的基于LSTM和PCA相结合的模型具有良好的应用前景。Tanveer和Hasan(2019)引入了一种基于波形的技术,利用ANN-LSTM模型从ECG和PPG波形中连续测量血压值。该方法优于基于特征工程的传统模型。在这项研究中,他们对所提出的模型与先前提出的模型的性能进行了比较。数据收集自MIMIC I数据库中39例ICT患者;他们对信号数据进行q小波变换(TQWT)以去除噪声和可调性。该模型由两层组成,一层由人工神经网络(ANN)从信号波形中学习特征,另一层由LSTM生成较低层次提取的特征与输出的收缩压和舒张压值之间的时间关系。值得注意的是,所提出的模型性能严重依赖于ECG和PPG周期分割,这需要精确检测ECG Rpeaks和PPG收缩期峰值。因此,本研究满足AAMI和BHS要求。然而,用于实现所提模型的数据集相对较小,建议在未来的工作中使用更全面的数据集。研究表明,光电容积描记(PPG)和心电图(ECG)特征可反映心血管系统动力学。

Park等人(2020年)介绍了一项研究,在心肺复苏(CPR)过程中使用人工智能,利用耳垂光体积描记法估算血压。采用长短时记忆(LSTM)模型,采用耳压仪(PPG)测量血压。LSTM体系结构包含三个层,分别是输入层、隐藏层和输出层。他们宣称,所提出的方法具有利用单耳PPG通过LSTM估计血压的潜力。C. Wang等人(2020)提出了一种利用神经网络模型从脉搏波信号测量血压的端到端方法。他们将脉搏波归一化,认为它是一个包含卷积层和循环层的神经网络的输入,对应的输出是血压。循环层采用门控循环单元(GRU)。最后,应用密集输出层生成估计的血压值,并在MIMIC数据集上进一步测试。本研究符合国际标准的要求。然而,对于这种技术来说,必须一次向神经网络提供一个脉搏波来估计血压。

最近,一项研究利用从MIMIC II数据库获得的ECG和PPG生物信号进行无创无袖连续血压估计(Senturk等人,2020年)。他们从这些生物信号中提取了时域、频域和混沌特征。此外,他们比较了不同的机器学习算法,如线性回归、袋状树、粗树、高斯过程回归(GPR)、高斯支持向量机,以及动态学习模型,如带有外源性输入神经网络的非线性自回归网络(NARX-NN)、递归神经网络(RNN)和长-短期记忆神经网络(LSTM-NN)。研究结果表明,混沌特征在血压测量中的性能较好,所提出的LSTMNN和反馈人工神经网络(NARX-NN)模型能提高混沌特征在血压测量中的性能。表3总结了使用PPG进行血压估计的循环神经网络。

表3 通过循环神经网络(RNN)对相关工作进行总结。

在这里插入图片描述

基于卷积神经网络(cnn)的方法

Schlesinger, Vigderhouse, Eytan和Moshe(2020)提出了两种使用PPG的卷积神经网络(cnn)进行连续无创无袖式血压计算的技术。第一种方法无需校准,第二种方法准确估计了校准时患者PPG和地面真实血压值的血压变化。该方法采用了Siamese神经网络体系结构和MIMIC-II数据库。Siamese网络包含两个相同的子网组件,使用相同的参数,同时处理两个独立的输入向量来计算可比较的输出向量。这些网络已被许多应用如签名验证(Bromley, Guyon, LeCun, Sackinger, &Shah, 1994),与索引文档匹配的查询(Neculoiu, Versteegh, &Rotaru, 2016)和人脸识别(Chopra, Hadsell, &LeCun(2005)。本研究为目前的PPG引入了两个CNN(卷积神经网络)模型,患者在相同的架构下校准PPG。他们通过CNN从PPG信号的谱图中提取光谱时间特征,并使用短时傅里叶变换(STFT)进行计算。该技术显示出良好的结果,并声称该方法可以充分用于许多其他实际的医疗应用。

一个被提议的模型(Esmaelpoor, Moradi, &Kadkhodamohammadi, 2020a)由两个阶段组成;第一阶段包含两个卷积神经网络(CNN)对PPG片段进行特征提取,然后分别估计收缩压和舒张压。第二阶段通过长短时记忆(LSTM)获取时间相关性。此外,通过纳入收缩压和舒张压之间的动态关系,所提出的模型的准确性得到了提高。表4概述了卷积神经网络用于PPG生物信号血压估计的研究工作。

表4 卷积神经网络(cnn)模型综述。

在这里插入图片描述

基于受限玻尔兹曼机的人工神经网络方法

Ruiz-Rodríguez等(2013)对基于深度神经网络的血压监测进行了研究。这项研究得到了临床研究伦理委员会的批准,并在巴塞罗那(西班牙)瓦尔德希布伦大学医院麻醉护理部门进行。本研究利用神经网络建立三层受限玻尔兹曼机,称为深度架构(deep Belief Network, DBF)。在这个DBF中,最上面一层代表回归模型,最下面一层是数据向量。对于数据收集,由于这是一种非侵入性方法,我们使用放置在第二至第四根手指上的PO(脉搏血氧测定)传感器来记录PPG信号。在桡动脉或股动脉置入20g和16g导管,记录有创的血压值。根据临床情况决定放置导管,并由医生决定导管的位置。对于每个研究参与者,同时连续记录血压和PPG信号30分钟,只有在观察到任何异常时才停止(例如,患者的运动,咳嗽等)。此外,这些30分钟的连续录音被分割成10秒的帧。这些帧被进一步研究,如果他们再次发现任何异常,他们会从数据中忽略这些PPG信号。在AAMI (Instrumentation)之后,为每一帧指定了最大和最小血压限值的曲线范围。动脉导管自动获得SAP、MAP和DAP。这是第一项将持续无创血压监测与有创血压监测(血压监测的金标准)进行比较的研究。本研究有一定的局限性;对有一致浸润性血压记录的患者进行检查,但在血压突变的情况下,系统的准确性可能不完美。此外,该研究未纳入心律失常患者,因为该障碍是由于血压波固有偏倚异常所致。由于呼吸系统变异而导致的固有变异的复杂性以及该项目相当大的共识局限性表明,目前临床实施是不可能的,应在未来集中解决这些问题。

Ripoll和Vellido(2019)引入了一种数据驱动的受限玻尔兹曼机(Restricted Boltzmann Machine, RBM),利用MIMIC数据库中的250名受试者数据实现了一种无创算法,用于血压评估。该方法使用PPG和ECG信号来计算脉冲传输时间(PTT),使用带有校准的脚到脚算法(Gaddum, alaststruey, Beerbaum, Chowienczyk, &Schaeffter, 2013)。停止校准后,结果有所改善,但性能下降,但本研究进行了6min无校准。首先,本研究证实了基于PTT回归模型的最新技术的微小改进。本研究的结果令人满意,达到了BHS协议的A级和B级。但也存在一些缺陷,如停止校准后模型性能下降;因此,它不能在临床环境中工作。此外,基于RBM的方法可能存在梯度消失问题,这可能会影响连续测量血压的过程。表5总结了使用PPG信号进行血压测量的Restricted Boltzmann Machine (RBM)的相关工作。

表5 根据限制性玻尔兹曼机(RBM)模型总结相关工作。

在这里插入图片描述

其他神经网络

1999年,John Allen和Murray(1999)进行了一项研究,探索血容量脉搏波形和血压之间的关系,这可以提供有关血管系统的有价值的生理数据。本研究收集了12名受试者在抬手、基线和抬手姿势下一分钟的PPG和无创手指血压数据。该系统采用了两种估计技术:线性自回归和通过非线性过程学习的输入训练的人工神经网络。这些研究结果表明,利用这些技术,生理数据可用于临床评估。Kim et al.(2006)介绍了一项利用脉冲传递时间(PTT)进行连续血压测量的人工神经网络和多元回归的比较研究。收集45名受试者(年龄22 ~ 32岁)的数据,通过PPG、ECG信号和BMI、身高、臂长、体重等生物特征参数计算PTT。此外,他们使用统计分析选择变量作为预测因子。这些参数被用来比较两种机器学习技术,多元回归和人工神经网络,作为估计的血压测量。结果表明,人工神经网络的性能优于回归模型,符合AAMI标准。

利用人工神经网络根据PPG信号计算血压(Kurylyak, Lamonaca等人,2013)。为了更好地描述压力变化和脉冲,使用MIMIC数据库作为训练数据。人工神经网络(ANN)输入向量检测了超过15000次心跳。每拍提取21个参数;收缩期上搏时间(SUT)、舒张期时间(DT)、收缩期和舒张期宽度分别为10%、25%、33%、50%、66%和75%。他们使用了一个有两层隐藏的前馈人工神经网络,第一层包含35个神经元,第二层包含20个神经元。收缩压为3.80 3.46 mmHg,舒张压为2.21 2.09 mmHg。该方法满足ANSI标准(Instrumentation, 1987),比线性回归方法具有更好的准确度。Lamonaca等人(2013)介绍了一种随时随地估算血压的智能手机方法。利用手机摄像头获取帧序列进行PPG信号提取。这些信号是通过检查从指尖捕获的帧序列上容积血的变化来评估的。从不同比例的PPG信号中提取收缩期上冲时间、舒张期时间和脉冲幅度宽度等特征。此外,采用多层前馈反向传播神经网络,通过N个输入神经元和2个输出神经元来估计收缩压和舒张压。模型训练使用MIMIC数据集完成(Goldberger et al., 2000)。实验是在Android智能手机HTC Desire S (Gargenta, 2011)上进行的。结果表明,收缩压与舒张压的最大差值为11 mmHg和12 mmHg。

Kurylyak, Barbe, et al.(2013)提出了采用PPG分析的人工神经网络对血压进行精确评估。该方法从MIMIC数据集收集PPG和A血压数据。进一步,将PPG特征和心率作为输入输入神经网络模型,得到收缩压、舒张压和平均血压作为输出。在A血压上使用卡尔曼滤波实现了对该模型的改进,该滤波技术的主要目的是去除位于频带外的测量噪声、频率伪迹。这种卡尔曼滤波技术使模型更有效地估计血压,并显示了20%的改进。在此基础上,采用N个输入参数和2个隐含层(第一层35个神经元,第二层20个神经元)实现了一种多层前馈反向传播人工神经网络,其中3个隐含层用于输出收缩压、舒张压和平均动脉压。使用不同时间实例的参考血压值分析了超过5000次单独的PPG心跳。Mohamad Kachuee等人(2015)批评了脉冲传输时间(PTT)方法,它是无创和无袖扣估计收压和舒张最有效的方法之一。然而,PTT已被证明与收缩压和舒张压有很强的相关性;这种关系很大程度上取决于每个人的生理特性。这是一个明显的障碍,因为PTT需要对每个人的准确血压进行校准。为了解决这个问题,Mohamad Kachuee等人(2015)提出了一种基于从PPG信号中提取的几个生理参数以及信号处理和机器学习算法的无校准方法。在BHS之后,研究结果表明,本技术的舒张压达到B级,平均动脉压达到C级。

Gaurav, Maheedhar, Tiwari和Narayanan(2016)提出了一种基于智能手机的使用PPG测量血压的技术。本研究使用心率变异性和PPG特征来测量收缩压和舒张压。他们从PPG信号的时间变化和幅度信息中提取了8个特征。此外,通过去除高频噪声,利用快速傅里叶变换(FFT)技术,从PPG二阶导数加速度体积图(AGP)中获得19个特征。一些AGP特征显示了个体信息,使其更准确地测量收缩压和舒张压。通过非线性统计计算增加了其他8个特征,包括准时率和心脏周期。在此基础上,加入HRV特征,利用人工神经网络对151487块数据进行收缩压和舒张压测量。对于训练集和验证集,该数据集进一步划分为80:20的比例。利用公共数据集对收缩压为 0.16 ± 6.8 0.16 \pm 6.8 0.16±6.8 mmHg和舒张压为 0.03 ± 4.7 0.03\pm 4.7 0.03±4.7 mmHg进行了准确度分析。

Xing和Sun(2016)提出了一种仅通过归一化PPG信号和提取特征来测量PPG血压的技术。他们介绍了PPG的理论背景、优势、局限性以及对PPG信号的解释。这些特征是通过快速傅里叶变换确定的,并进一步用于训练人工神经网络。使用MIMIC-II数据库中的69例患者数据,用约17万波形训练神经网络模型。此外,23名志愿者的数据也被使用和依赖于PPG信号。Levenberg-Marquardt算法将70%的数据用于训练,15%用于测试,15%用于验证ANN模型。根据作者的说法,这项工作显示出强劲的性能;然而,前馈神经网络并不是长期连续测量血压的合适选择;此外,FFT功能不足(El-Hajj &Kyriacou, 2020)。

作者(L. Wang, Zhou, Xing, &Zhou, 2018)提出了一种仅从PPG信号中实现多锥方法(MTM)的逐拍血压测量方法,并导出了形态学特征。利用MIMIC数据库对人工神经网络模型进行训练和测试。该技术利用了舒张期时间(DT)和收缩期上搏时间(ST)两种形态学特征,并利用MTM提取了低频率(0.1 10 Hz)的谱特征。此外,这些特征通过一个多感知器被输入到神经网络架构中,该感知器有22个输入神经元,两个输出为收缩压和舒张压。本研究收缩压和舒张压的平均误差分别为0.0217 4.8950 mmHg和0.0975 2.9160 mmHg。该方法与基于线性回归和RSVM的方法在MATLAB中进行了进一步的评估和比较,结果表明该方法性能较好,可用于可穿戴设备或移动应用。

Shimazaki, Bhuiyan, Kawanaka和Oguri(2018)介绍了一种使用无袖PPG装置,通过特征提取测量血压的方法。使用自动编码器从坐位5分钟获得的PPG波形中提取特征,然后使用人工神经网络测量收缩压。采用自编码器特征、常规特征和个人信息的多层神经网络,第一隐藏层50个神经元,第二层隐藏层25个神经元,输出层1个神经元估计收缩压。他们声称,自动编码器用于PPG特征提取充分提供了血压估计和提高精度。然而,该方法不满足AAMI标准,该方法只测量了收缩压。利用ECG和PPG生物信号的属性,利用人工神经网络对每个心跳进行连续收缩压和舒张压测量(S entürk等,2018b)。本研究使用PhysioNet MIMIC-II数据库收集心电图、PPG信号和目标A血压值。此外,他们从ECG和PPG生物信号中提取了22个基于时域的特征。该模型的精度较高,收缩压为0.14 2.55(平均标准差),舒张压为0.004 1.6。

Gonzalez Viejo, Fuentes, Torrico和Dunshea(2018)引入了原始视频分析,利用PPG和食物视觉分析的效果来预测HR(心率)和血压。他们提出了两个模型;一种是使用具有18个输入、10个隐藏层和3个输出神经元的人工神经网络来估计准确的心率和血压,因为人工神经网络已经在基于心率预测心脏疾病的不同研究领域(Acharya, Bhat, Iyengar, Rao, &(Gothwal, Kedawat, &库马尔,2011)。第二种模型采用基于隐藏层5个神经元和2个输出神经元的浅层神经网络和时间序列方法对PPG信号进行精确预测。他们认为这项工作可以用作一种生物识别工具,并且比现有的其他视频预处理技术需要更少的处理时间。然而,他们并没有将他们的结果与AAMI或BHS等标准方案进行比较。B. Wang等人(2019)提出了一项研究,从两个信号中提取了39个特征。此外,通过检查与血压相关的信号选择了10个特征。然后,采用线性回归、支持向量机和神经网络对连续血压进行预测。根据AAMI和BHS标准,结果表明,通过遗传算法优化的人工神经网络对血压的估计具有更好的精度。表6总结了PPG生物传感器用于血压测量的其他神经网络方法。

表6 根据其他神经网络模型总结相关工作。

在这里插入图片描述

总结

深度学习不需要特征提取;这些可以直接从输入数据集中提取,而不需要任何学习知识或干预(Schlesinger等人,2020)(Esmaelpoor, Moradi, &Kadkhodamohammadi, 2020b) (C. Wang等人,2020)。然而,这些模型是复杂的神经网络,在体系结构中有多个隐藏层,计算复杂度更高。因此,无论是否使用传统的特征提取技术,深度学习都被用于这一研究领域,并取得了显著的成果。

光电容积描记(PPG)和心电图(ECG)

对心电图(ECG)和光电容积描图(PPG)进行了研究,并显示了有前景的心血管评估结果(Kim等人,2006年)(Ripoll &Vellido, 2019)。大多数情况下,诊断心血管疾病的首选技术是心电图。然而,最近另一种无创PPG技术被认为是一种有前途的心脏相关应用诊断方法,一种可靠且廉价的技术(Chakraborty, Sadhukhan, Pal, &密特拉,2020)。通过PPG可以计算出许多与心脏相关的参数,如血压、心率或脉搏速度(Liang, Chen, Ward, &Elgendi, 2018)。此外,PPG信号技术在个人医疗保健系统心肌梗死治疗方面取得了良好的结果(Chakraborty等人,2020)。在本节中,我们将讨论对这两种传感器进行比较分析的一些研究。

Jan等人(2019)利用时域估计方法,对健康受试者进行了一项研究,以调查ECG和PPG衍生参数之间的一致性,包括是否有呼吸。观察到,在呼吸和控制呼吸两种给定的情况下,脉搏率和心率之间存在一致性。而在呼吸控制任务中,心率变异性(HRV)与脉搏率变异性(PRV)有显著差异。本研究结果还表明,心电图的参数与PPG的参数吻合良好。本研究提示ECG信号比PPG信号更具有特异性,基于PPG的仪器不能作为检测心率变异性(HRV)的筛查工具。Pereira等人(2020年)对应用机器学习和统计技术的PPG检测房颤(AF)进行了综述。虽然PPG可以替代ECG对AF的连续检测,但仍具有一定的挑战性。毫无疑问,基于深度学习的PPG分析显示了显著的AF检测结果,但应用于可穿戴设备仍然是一个很大的挑战。机器学习方法就像一个黑匣子,不能为预测提供临床解释。因此,基于ppg的AF检测能否通过深度学习实现临床效果还存在争议。

临床筛查产妇心率(MHR)最准确的技术是心电图(ECG)。然而,许多胎儿监护仪不支持这项技术,因为在生产过程中通过心电图记录MHR不容易。另一方面,光电容积描画(PPG)可以与脉搏血氧测量传感器一起用于测量MHR,并与胎儿监护仪连接。在某些情况下,需要在分娩过程中持续调节产妇的氧饱和度。一些女性认为,由于电极放置在胸部,PPG比ECG更方便舒适。此外,最近已将脉搏血氧测定与一些胎儿监测仪结合起来。因此,使用PPG时不需要额外的设备来监测MHR。ECG信号通常采用拍频检测方法,而PPG信号通常采用频谱分析方法。Gonçalves、Pinto、Silva、Ayres-de-Campos和Bernardes(2016)进行了一项研究,比较生物信号、ECG和PPG,以检测产妇分娩期间的心率。他们的结论是,虽然PPG不能像心电图一样捕捉到MHR信号的更快振荡,但在分娩前的最后10分钟更容易出现信号丢失。然而,如果使用适当的MHR变化指数和适当的截止间隔适应,PPG可以被认为是监测分娩期间MHR的替代方法。

血压是一种早期风险指标,可通过有创和无创两种方法测量。然而,如果需要持续的血压监测,使用有创技术对患者是不稳定的。在这种情况下,非侵入性手术是有帮助的(Martínez et al., 2018)。Yang、Zaki、Morgan、Cho、Correia、Wen和Zhang(2018)的研究表明,结合ECG和PPG信号可以提高血压测量的准确性。PPG可以通过两种方式测量血压:异步性(仅使用PPG)和同步性(使用PPG和另一种与PPG同时测量的生物信号)(Liang, Chen, Ward等人,2018)。Ghosh等人(2016)基于PTT进行了一项研究,利用PPG和ECG信号估计14名受试者在五种不同姿势(行走、站立、坐姿、骑自行车、仰卧)下的连续血压,并使用线性回归模型。通过使用预处理的PPG信号,他们取得了显著的准确性。站姿和坐姿时PTT 血压估计值较低,步行或骑车时血压估计值较高。研究表明,基于ptt的血压测量在静止状态下有显著的结果,但在身体运动状态下没有准确的结果。

Zhang Q., Zhou, and Zeng(2017)提出了一种基于单导联ECG和PPG传感器的可穿戴式无袖带收缩压和HR监护仪。需要有效和持续的收缩压(收缩压)和心率(HR)测量,用于健身、情绪和压力跟踪应用。然而,这也面临着一些挑战,比如模型不足、缺乏可靠的收缩压模型以及耐磨性差。在这项研究中,可穿戴性是通过将两个传感器集成在一个单臂带实现的。首先采用ECG和PPG心跳对测量PTT,然后采用PTT&HR-收缩压模型监测收缩压。然后,开发了硬件原型,并收集了10名受试者的数据来评估模型。该模型能够实现稳健的收缩压估计,并能够替代胸部心电图信号,有助于长期高血压、心脏相关健康和健身管理。(Tamura et al., 2014)此外,PPG信号的测量比ECG信号更方便,这是无可争辩的。这就是为什么PPG可以作为ECG分析HRV的替代来源(Gil等人,2010)(Heathers, 2013)或监测呼吸频率(Nilsson, Johansson, &卡尔曼,2000)。

ECG提供心脏电功能的信息,并监测胸痛、心脏病发作、麻醉护理、心律失常、压力测试和心脏电生理。另一方面,PPG是一种光学获得的体积描画仪,用于测量皮肤中的血容量变化、监测心率、血压、呼吸监测、麻醉监测和氧饱和度。ECG和PPG的主要区别在于ECG是通过放置在身体上的电极来监测心脏活动的电功能。然而,PPG使用LED和光电探测器监测动脉血容量。PPG可以通过反射光或透射光得到,因此需要单接触点进行测量,便于连续测量。相比之下,ECG需要测量整个心脏,这意味着至少需要两个接触点,一个负极和一个正极。这个连接只能在有限的时间内建立。表7提供了PPG和ECG生物信号的一般比较。

表7 心电图vsPPG。

在这里插入图片描述

数据集

其中一个数据库是MIMIC-II(重症监护中的多参数智能监测)(Saeed et al., 2011),这是一个包含数千条数据记录的大型数据集。它包含与生理信号、血压和其他波形有关的记录。已经发现,在使用该数据集评估PTT时,PPG和ECG数据信号没有完全同步(Choi, Zhang, &Ko, 2013)。而多参数监测系统通过使用电子设备和对观察到的信号使用滤波软件同时采集多个生理参数,导致时间上的额外延迟(高达500 ms) (Mohammad Kachuee等人,2016)。因此,不建议使用MIMIC数据库来测量PTT或PAT (Elgendi等人,2019)。此外,数据收集的程序对雇员不明显,也不干扰病人的保健或监测措施。随后,Johnson等人(2016)收集了MIMIC-III数据集。它提供了2001年至2012年期间不同医院收治的53,423名成人(16岁或以上)重症治疗单元的数据。它还包含了2001年至2008年收治的7870名新生儿的信息。这些数据包括38597名成年人和49785名住院患者。成年患者中位年龄为65.8岁。

随后,昆士兰大学的生命体征数据集在皇家阿德莱德医院记录了32例病例(D. Liu et al., 2012)。每个病例的信号长度从13分钟到5小时不等,包含原始PPG信号波形的无创血压记录。在数据分割期间进行了人工检查,以确保PPG信号与运动系统的不适当质量,从而有效地应用机器学习模型(Khalid等人,2018)。然而,该数据集有一定的局限性,如病例数量有限,在常规外科手术不涉及重大关键事件的情况下,数据用于异常事件识别的应用受到了限制。PPG-血压数据集(Liang, Chen, Liu, & Elgendi, 2018)最近发布,在中国桂林的桂林人民医院记录。建立了一个由PPG传感器样本、单片机和相应应用程序组成的定制化移动硬件平台。它包括入院患者的血压读数以及PPG信号。它包含了219名年龄在21岁到86岁之间的患者的记录。它还涵盖了高血压和糖尿病等其他疾病。使用定制的探测仪和基于android studio的匹配应用程序记录PPG波形信息。PPG探测仪采用红外光和传输机制采集PPG指尖波形数据。数据通过蓝牙实时传输到相应的应用程序。该应用程序可以控制检测探头,实时显示波形,并进行PPG波形信号质量评估,以保持高质量的PPG波形段。血压由Ref, Omron HeM-7201 (Omron公司,京都,日本)认证的上臂血压计测量。

随后,真实世界的PPG数据集包含了35名健康受试者记录的PPG信号(暹罗,2019年)。每个PPG信号包含300个采样,采样率为50个采样/秒(6个采样)。数据集包括2074个PPG信号,分为两组:训练组和测试组。用于训练/验证的组大约包含整个数据集的66%。测试组大约占总数据集的34%。另一个新发布的数据集是PPG数据集(Reiss, Indlekofer, Schmidt, &Van Laerhoven, 2019年)的每日速率评估(PPG DaLiA),旨在克服在记录IEEE SPC数据集时使用的低体力活动的限制。在数据收集中,有15个人进行了与日常活动类似的体育活动。这个数据集明确地用于在身体运动环境中识别心率。因此,我们在进行步行等运动时记录PPG信号(Lee, Chung, &李,2018)。然而,PPG DaLia数据集提供的年龄组信息有限。此外,在PPG信号记录仪中加入陀螺仪和加速度计可以提高精度。表8总结了PPG生物信号的公开数据集。

表8公开可用数据集汇总。

在这里插入图片描述

实验

在本节中,我们对不同的传统特征提取技术进行了综合分析。利用人工智能算法对PPG信号进行分析和预测,并对不同特征提取技术的性能进行评估。特征提取是PPG分析中测量和分析心血管活动不可或缺的环节之一。在这项研究中,我们使用了2018年发布的开源PPG血压数据集进行初始实验。数据集收集了219名受试者的657条数据记录。这些记录包括心率、收缩压、舒张压以及高血压和糖尿病等疾病。该患者的年龄在20 ~ 89岁之间。数据集中每个受试者的每条记录都包含PPG信号数据。该数据集用于无创心血管疾病预测。对比分析的总体流程如下图5所示,作为这些实验的框架

在这里插入图片描述

图5所示。特征提取技术的比较。

  • 从参考高血压和心率数据集中提取PPG信号进行分析。
  • 数据预处理应用于PPG信号数据去噪和归一化。
  • 为了比较,我们使用了特征提取方法。这些技术包括PPG波分析、快速傅里叶变换(FFT)、功率谱密度(PSD)和信号的最佳质量指数。
  • 机器学习算法通过10次交叉验证进行训练,并进行性能评估。

数据预处理

在将信号数据用于特征提取之前,需要解决几个挑战。最重要的问题是,我们从PPG获得的信号数据通常是有噪声的,这是由于记录PPG时患者的运动或身体状态造成的。这种噪声源有可能使信号的高频内容失真。此外,数据可能包含一些缺失的样本和异常值,这可能会扭曲结果。数据信号的去噪方法有多种。在本研究中,我们对输入信号应用连续小波变换(CWT)对信号进行去噪,使信号波形数据更加高效。我们在文献中发现,研究人员使用连续小波变换(CWT)作为信号的特征提取技术(Gao et al., 2016)。在这项研究中,我们使用CWT去噪信号,以获得更好的结果和准确性。利用小波变换进行信号去噪的过程包括三个步骤:信号分解、阈值分割和信号重构。阈值是图6(a和b)中所示的噪声水平的估计。我们已经应用了5级小波变换对所需信号去噪。此外,CWT阈值在信号去噪中起着至关重要的作用。除此之外,信号数据还需要更多的数据预处理来实现信号数据的规范化。为此,对信号数据的所有分段进行了数据归一化处理。首先,对PPG信号进行滤波,去除基线徘徊;进一步,使用最小和最大归一化方法,将PPG信号归一化到范围[0,1]。然后将归一化信号应用到一个固定大小的模型中,使所有PPG信号片段符合150个数据点。得到的信号随后被用于特征提取方法。

在这里插入图片描述

图6所示。(a):连续小波变换去噪前后的信号。(b):在不同水平上使用CWT进行信号分析。

特征抽取

本节应用了不同的特征提取技术,并对不同模型的精度和效率进行了比较。特征提取是从给定数据中提取最准确和最有价值的信息以提高性能和结果的关键步骤。对PPG信号的不同特征提取技术进行了研究。我们从三个不同的领域对四种特征提取技术进行了综合分析。首先,我们进行了传统的信号波分析技术。它给出了来自不同点的实际PPG波的信息。然后,我们利用快速傅里叶变换(FFT)和功率谱密度(PSD)对PPG信号进行频率分析。我们还利用最优信号质量特征对PPG信号进行统计分析。

  • 波分析:为了从PPG信号中提取波浪分析特征,我们对不同PPG信号位置进行了宽度分析。当信号幅值增加时,收缩期宽度分别为10%、25%、33%、50%、66%和75%。此外,当信号从峰值下降时,舒张宽度也相同,如图7所示,这是波分析特征提取。

在这里插入图片描述

图7所示。波分析基于宽度的特征。

  • 快速傅里叶变换:快速傅里叶变换算法通过计算信号序列的离散傅里叶变换将信号转换到频域。在这个过程中,一个信号被分解成一个小的值集,把它转换成一个频域。在这项研究中,我们通过FFT计算PPG信号的频率,这是一种更快的DFT版本。
  • 功率谱密度:功率谱密度是一种特征提取技术,它将信号的功率表示为频率函数。研究表明,观察PPG信号的光谱特征为PPG变异性的失血量检测提供了满意的结果(Shah, Kazmi, Sidek, &Khan, 2014) (Middleton et al., 2008)。
  • 最优信号质量指数:许多制造公司,如Masimo(美国,CA)和世界著名的飞利浦(荷兰)公司,都使用最优质量指数之一作为PPG信号质量评估的标准黄金指数(Hartmut Gehring, 2002) (Colquhoun, Forkin, Durieux, &蒂埃尔,2012)。我们从PPG信号中提取了一些最优信号质量指标,并将它们作为本研究的特征。

高血压预测

在本节中,我们使用Logistic回归(LR)、线性支持向量机(SVM)、最近邻(kNN)、梯度Boosting分类器、决策树(DT)和随机森林(RF)来研究PPG信号分析中的高血压分析。此外,我们还研究了它们随时间变化的所有分类性能。这些实验是使用Python1 A编程语言进行的,包括支持库(如sci-kit-learn library2)。针对给定的数据和处理时间,进一步评估了这些模型的准确性。此外,还对分类器的性能排名进行了统计显著性分析。

结果与讨论

这一部分包括所有实验的结果,可以根据特征的提取和选择进行分析。在这个实验中,我们应用连续小波变换(CWT)去噪数据集。进一步的规范化应用使数据集更高效。参数调整已实现作为梯度助推器。下表9给出了每个机器学习分类器在不同特征下的平均分类准确率。这一部分包含了所有实验的结果,可以根据特征提取和选择进行分析。在这个实验中,我们应用连续小波变换(CWT)去噪数据集。进一步的规范化应用使数据集更高效。参数调整已实现作为梯度助推器。下表9显示了不同特征下每个机器学习分类器的平均分类准确率

表9使用Wave Analysis特征、FFT特征、PSD特征和OSQI特征的分类模型平均准确率。

在这里插入图片描述

此外,为了获得更好的结果,我们应用了一些超参数,并与最佳参数调整到分类器。为了验证,使用PPG信号特征和高血压分析参考信息对机器学习算法进行10次交叉验证训练。为此,每个fold有一个fold用于测试,剩下的9个fold用于训练算法。我们提取特征,应用10倍交叉验证,并计算平均平均准确率为分类器。基于此分析,每个分类器的交叉验证次数对特征提取技术的准确率影响如图8(a f)所示。

在这里插入图片描述

图8所示。(a-f):与各种机器学习算法比较Wave分析、FFT、PSD和OSQI特征在准确率方面的差异。

这些实验是在MacBook Pro上进行的,四核英特尔酷睿i5,处理器速度为2.4 GHz。决策树实现了分类的最佳训练运行时间。然而,训练数据的最差运行时间是随机森林,如表10所示。

表10 分类器所花费的训练时间(每秒运行时间)。

在这里插入图片描述

统计上显著的对比

为了比较分类器的准确性,我们将提取的所有特征作为一个特征集,然后对分类器进行10倍交叉验证,并采用统计显著性检验Friedman检验(Zimmerman &Zumbo, 1993)。统计检验假设如下

零假设(H0):分类性能没有差异。

H1:分类算法的平均性能有显著性差异。

我们使用t检验方法对分类器配对平均准确率进行假设检验,其中我们实现了p值(0.00194,0.0001)<所有配对检验均为0.05。此外,我们使用了95%置信区间的Nemenyi-test(非参数)技术来展示分类器的性能。最后,根据平均性能计算出所有分类器的临界差异。

因此,由图9可以看出,我们分析了6种用于高血压预测的分类器,logistic回归(LR)在其他分类器中,根据准确性和临界差值排名最好。我们从最近邻(KNN)算法得到最差的性能。逻辑回归和支持向量机之间有一个非常名义上的区别。根据这些分析,零假设将被拒绝。因此,我们可以得出结论,当我们结合这些特征时,logistic回归在高血压分析分类中取得了最好的结果。

图9所示。分类器的平均排序取决于结合特征的准确性。

在这里插入图片描述

深度学习

此外,我们对每种特征提取方法都实现了长时短时记忆(Long-Term-Short Memory, LSTM),以了解我们的深度学习模型的性能。由图10可以看出,使用PPG波分析特征的LSTM平均性能达到75.05%的精度,是其他特征方法中精度最低的。基于FFT的特征平均准确率为75.65%。然而,功率谱密度特征与FFT相似,差异较小,准确率为75.50%。在所有特征中,基于信号质量指数的最优特征表现最好,平均性能达到75.90%。

在这里插入图片描述

图10所示。(a-d):采用不同特征技术的LSTM预测高血压。

结果与讨论

回归分析采用线性回归、随机森林(RF)、k近邻(KNN)和支持向量机(SVM)。将这四种基于特征的集合与机器学习算法进行了比较。对这些算法进行了心率估计精度的评估。为此,对所有细分市场进行10次交叉验证;每个交叉段包含一个参考心率值和预测心率值,并以此计算差值。然后计算绝对平均值和标准偏差,以整体估计心率精度。本实验已使用平均绝对误差(MEA)和标准偏差(STD)进行评估,并在表11中给出。由表9和表11可以看出,精度的标准差较低,说明所有的精度值都在平均值或平均精度附近。可以说,模型是稳定的,得到的值没有漂移。

表11 比较机器学习算法与四种特征集的性能。

在这里插入图片描述

为了达到最佳效果,我们应用了大量的超参数,并用算法的最佳参数进行了优化。值得注意的是,超参数包括估计器的数量和森林的最大深度的随机森林。我们为估计器提供了一个范围:10、121、10,最大深度为1、10、20、30和40。快速傅里叶变换特征选择的参数估计量为120,深度为40。基于功率谱密度的特征选择参数估计:60,深度:10。第三个特征基于最优信号质量指数,选取参数估计器:50,深度:1。对于k-最近邻,超参数包括邻居的数量、权重和算法。此外,支持向量机的超参数为正则化C、核和伽玛。预测和实际心率值可以在图11(a - d)中观察到如下所示的分类器线性回归,随机森林,k-最近邻和支持向量机

在这里插入图片描述

图11所示。(a-d):通过学习算法的心率实际和预测分析。

我们应用了四种算法进行心率预测,并利用快速傅里叶变换特征获得了平均误差最小的k最近邻(KNN)模型的最佳结果。然而,三种算法之间没有显著差异。因此,我们可以通过KNN优于所有的结果来得出本实验的结论

我们对PPG信号进行了分析,并对其进行了先进的信号处理技术。除此之外,我们还引入了一项综合分析,研究了使用真实数据集的传统特征提取技术与高血压分类和心率预测性能之间的相关性。我们将实验分为两部分

不同的特征提取技术与预测的分类性能之间是否存在相关性?分类性能结果提供了足够的证据,表明该方法测量的性能不同于非典型特征工程方法。然而,这些差异很小。此外,这些实验使用不同的分类器进行,其中Logistic回归性能最好的所有提取的特征集作为一个特征集的高血压预测。然而,利用快速傅里叶变换特征进行高血压预测,决策树获得了很高的精度。使用基于快速傅里叶变换特征的k近邻(KNN)在心率估计方面优于所有其他特征工程技术。

哪种特征提取技术最适合心血管相关指标的预测?结果表明,每种特征提取技术在心率估计中的精度差异很小。然而,由于生物医学领域的敏感性,我们仍然不能忽视精度之间的微小差异。此外,在特征工程方面,结果表明,每个特征向量提取混合复杂输入。在高血压检测的其他特征提取技术中,快速傅立叶变换特征显示了显著的结果。然而,通过分析整体结果,我们可以得出结论,传统的心率估计特征提取技术和快速傅里叶变换特征之间的精度差异很小,而基于快速傅里叶变换的特征在高血压分析中表现突出,优于其他特征技术。

未来的研究挑战

已有的工作表明,利用PPG生物信号估算血压具有良好的效果,并为其奠定了坚实的基础。最后,展望了该领域的研究方向。

  • 可解释的人工智能:深度学习在许多医疗保健领域发挥了重要作用,取得了出色的成果。然而,它被认为是一个黑匣子,因为它缺乏进一步解释结果所需的说明性知识。可以看到,由于机器学习在全球多个领域的杰出表现,对机器学习有巨大的需求,但仍然存在与结果信任相关的担忧。因此,需要基于深度学习的算法具有可解释的、透明的和可信的结果,这导致了一种可解释的方法。并不是所有的应用都需要解释。然而,对于金融、医学、法律和国防等敏感应用,需要解释机器学习算法的结果。
  • 最优特征选择:该领域的研究大多采用传统特征工程技术中的特征提取(Monte-Moreno, 2011) ((Shen et al., 2015) (S. Chen et al., 2019)。此外,最新研究表明,研究人员正试图研究从算法自动派生的基于机器学习的特征(Park等人,2020)(C. Wang等人,2020)(Schlesinger等人,2020)。然而,医生很难相信这样的应用程序,没有明确显示从结果中选择的特征。因此,有必要了解如何从生物信号中选择最优特征,从而在结果的可靠性下实现高性能。
  • 性能:许多研究人员提出了不同的方法(Dey et al., 2018) (B. Zhang et al., 2019),以满足健康标准和模型的准确性。尽管如此,仍需要进一步探索以实现高性能,以满足所有标准,从而提出具有可靠措施的临床应用。机器学习的浅层和深层学习模型都可以取得优越的性能,但其结果的能力还有待提高。因此,如何提高模型的鲁棒性是当前研究的热点和挑战,因为我们无法解释模型如何以及为什么提高性能。
  • 合作-该领域需要更好的理解:机器学习专家和该领域的医学专家需要合作,以更好地理解该研究领域,并取得最优和稳健的结果。由于专家之间缺乏合作,许多研究领域受到了影响;但是,它可以为许多研究领域做出贡献,并取得优秀的成果。

结论

本文对迄今为止基于机器学习的PPG信号血压估计的最著名研究工作进行了广泛的调查。首先,我们从许多研究人员使用的文献中讨论了特征工程方法。然后,我们概述了使用带有汇总表的PPG信号实现的血压测量的浅到深度学习模型。我们还讨论了PPG和ECG与现有重要发现的关系。除此之外,我们还将一些传统的特征提取与应用各种机器学习算法进行高血压预测和心率估计的性能进行了比较分析。结果表明,在使用快速傅里叶变换(FFT)特征进行高血压分析时,决策树(DT)取得了最好的结果,而k近邻(kNN)在心率预测方面优于支持向量机(SVM)、线性回归(LR)和随机森林(RF)。此外,我们用汇总表和引用详细介绍了一些数据集。最后,我们总结了未来最有希望在该研究领域取得稳健成果的潜在研究挑战。我们希望这篇综述可以提供各种研究人员和利益相关者对该领域的关键方面的全面理解,阐明最显著的进展,并对预期的未来方向提供一些光明。

的最著名研究工作进行了广泛的调查。首先,我们从许多研究人员使用的文献中讨论了特征工程方法。然后,我们概述了使用带有汇总表的PPG信号实现的血压测量的浅到深度学习模型。我们还讨论了PPG和ECG与现有重要发现的关系。除此之外,我们还将一些传统的特征提取与应用各种机器学习算法进行高血压预测和心率估计的性能进行了比较分析。结果表明,在使用快速傅里叶变换(FFT)特征进行高血压分析时,决策树(DT)取得了最好的结果,而k近邻(kNN)在心率预测方面优于支持向量机(SVM)、线性回归(LR)和随机森林(RF)。此外,我们用汇总表和引用详细介绍了一些数据集。最后,我们总结了未来最有希望在该研究领域取得稳健成果的潜在研究挑战。我们希望这篇综述可以提供各种研究人员和利益相关者对该领域的关键方面的全面理解,阐明最显著的进展,并对预期的未来方向提供一些光明。

  • 6
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值