基于EOG的异步虚拟键盘眼动检测和注视估计
【摘要】
这项工作的目的是开发一种新的基于眼电图(EOG)的虚拟键盘,其具有标准的QWERTY布局,与类似的最先进系统不同,它允许用户直接和异步地从任何位置到达任何图标。使用新的双通道输入线性回归模型将扫视EOG电位位移映射为角度凝视位移,该模型考虑了从水平和垂直EOG信号分量中联合提取的特征。使用该技术,视线位移估计误差为1.32±0.26◦ 和1.67±0.26◦ 在水平和垂直方向上分别实现了一种性能,该性能也被发现通常在统计上显著优于使用一个模型为每个EOG组件分别建模水平和垂直方向上的关系而获得的性能,如文献中通常使用的那样。
此外,本文还提出了一种基于阈值的方法来实时检测EOG信号中的眼球运动,然后使用基于EOG峰值和梯度特征的参数和信号形态分类器的新级联将其分类为眼跳或眨眼。这导致平均眼跳和眨眼标记准确率分别为99.92%和100.00%,表明使用所提出的算法可以可靠地实时检测和区分这两种眼球运动。当使用这些技术与拟议的基于EOG的异步虚拟键盘交互时,受试者的平均书写速度达到了每分钟11.89±4.42个字符,这一性能随着用户体验的提高而显著提高
layout which,
布局,
reach any icon
到达任意图标
directly and asynchronously.
直接和异步。
saccadic EOG potential displacement
扫视性EOG电位位移
signal components
信号组件
saccades or blinks
扫视或眨眼
gradient features.
梯度特征
a novel cascade
新型级联
parametric and a signal-morphological classifier
参数和信号形态分类器
improve substantially
大幅改善
【1. Introduction
1、引言】
如今,计算机被视为无处不在,通常只需要很少的努力即可使用。然而,患有运动障碍的个体,例如被诊断为肌萎缩侧索硬化症(ALS)或瘫痪中风患者,在自主性和对此类设备的控制方面可能会受到严重挑战。
尽管受到不同条件的限制,但眼睛通常是最后一个受到影响的器官,因此,基于眼动的人机界面(HCI)系统可以为此类智能系统提供替代通信通道,使患有这些条件的个人更加独立,提高生活质量[1]。
近年来,这种基于眼睛的人机交互系统已被广泛开发,使用基于视频眼球成像(VOG)的技术,它使用相机和图像处理算法来跟踪用户的眼球姿势(眼睛位姿)。尽管基于VOG的技术比基于眼电图(EOG)的技术具有更好的分辨率,但它们在计算上要求很高,易受照明条件的影响,对用户的移动很敏感,并且通常还需要外部照明源。替代眼动记录技术包括红外反射眼图,通常仅限于记录水平眼动;或者巩膜搜索线圈技术,这是一种半侵入性技术,因为它要求用户佩戴带有嵌入式线圈的隐形眼镜[2]。
另一方面,EOG通过捕捉人眼产生的电活动,可以为这些技术提供一个很好的替代解决方案,人眼的行为类似于电偶极,其正负极分别位于角膜和视网膜。事实上,这会产生0.4–1.0 mV范围内的电位差,称为视网膜角电位(CRP),从而产生电场。具体来说,EOG使用一组基于凝胶电极非侵入性地捕捉CRP产生的电活动,该电极附着在眼睛周围眶周位置的面部[2,3]。
ubiquitous,无处不在。
mobility impairments,
活动障碍,
an alternative communication channel
替代通信信道
eye movement-based human–computer interface (HCI) system
基于眼动的人机界面(HCI)系统
last organs
最后的器官
a better resolution
更好的分辨率
susceptible to
易受
sensitive to
敏感于
normally require
通常需要
create a potential difference
产生电位差
the corneo-retinal potential (CRP)
视网膜角电位(CRP)
creates an electrical field.
创建电场。
这项工作涉及到使用EOG信号与虚拟键盘应用进行交互。最先进的基于EOG的虚拟键盘通常要求用户进行重复的上、下、左、右和可能的斜视运动,以离散的固定大小的步骤在图标上盘旋[1,4,5],或者通过从屏幕中心向放置在外围的一组图标进行眼球运动来进行后续的图标选择,以抄写每个字符[6,7]。相比之下,拟议的虚拟键盘允许用户从屏幕上的任何位置访问任何图标。具体来说,这是通过模拟EOG信号中眼球运动的电压-角度关系来实现的,以允许直接估计受试者的扫视角位移,而不是简单地检测扫视的方向;因此,受试者可以在一个步骤中从一个目标移动到最终目标目的地,从而消除了必须通过中间位置或从屏幕上的中心位置重复发起眼球运动的限制。拟议的虚拟键盘也是异步控制的,因此不需要在提示间隔内执行眼动[6,7]。具体来说,这是通过提出一种新技术来实现的,该技术通过实时处理EOG信号来检测用户的扫视运动并将其与眨眼区分开来。这还允许用户执行检测到的特定眨眼序列,以解决Midas触摸问题,这是文献中通常忽略的一个方面。
perform repetitive
重复执行
oblique saccadic movements
斜扫视运动
hover over icons in discrete fixed-sized steps
将光标悬停在离散的固定大小的图标上
saccadic angular displacement
扫视角位移
intermediary locations
中间位置
within cued intervals
在提示间隔内
in the literature.
在文献中。
在文献中,EOG信号中眼球运动的电压-角度关系通常通过分别分析水平和垂直EOG分量来建模,特别是通过对每个EOG分量采用一个模型来分别建模水平和垂直方向上的注视角度和EOG电位之间的关系[8-10]。然而