EOG-based eye movement detection and gaze estimation for an asynchronous virtual keyboard基于EOG的异步虚

研究开发了一种新的EOG驱动虚拟键盘,能异步直达任意图标,通过双通道线性回归模型精准估计眼动,实现1.32±0.26°和1.67±0.26°的低误差。此外,文中提出实时眼跳眨眼检测算法,标记准确率高达99.92%和100.00%,并展示了与虚拟键盘交互时的11.89±4.42cpm书写速度提升。
摘要由CSDN通过智能技术生成

基于EOG的异步虚拟键盘眼动检测和注视估计

【摘要】

这项工作的目的是开发一种新的基于眼电图(EOG)的虚拟键盘,其具有标准的QWERTY布局,与类似的最先进系统不同,它允许用户直接和异步地从任何位置到达任何图标。使用新的双通道输入线性回归模型扫视EOG电位位移映射为角度凝视位移,该模型考虑了从水平和垂直EOG信号分量中联合提取的特征。使用该技术,视线位移估计误差为1.32±0.26◦ 和1.67±0.26◦ 在水平和垂直方向上分别实现了一种性能,该性能也被发现通常在统计上显著优于使用一个模型为每个EOG组件分别建模水平和垂直方向上的关系而获得的性能,如文献中通常使用的那样。

此外,本文还提出了一种基于阈值的方法来实时检测EOG信号中的眼球运动,然后使用基于EOG峰值和梯度特征的参数和信号形态分类器的新级联将其分类为眼跳或眨眼。这导致平均眼跳和眨眼标记准确率分别为99.92%和100.00%,表明使用所提出的算法可以可靠地实时检测和区分这两种眼球运动。当使用这些技术与拟议的基于EOG的异步虚拟键盘交互时,受试者的平均书写速度达到了每分钟11.89±4.42个字符,这一性能随着用户体验的提高而显著提高

layout which,

布局,

reach any icon

到达任意图标

directly and asynchronously.

直接和异步。

saccadic EOG potential displacement

扫视性EOG电位位移

signal components

信号组件

saccades or blinks

扫视或眨眼

gradient features.

梯度特征

a novel cascade

新型级联

parametric and a signal-morphological classifier

参数和信号形态分类器

improve substantially

大幅改善

【1. Introduction

1、引言】

如今,计算机被视为无处不在,通常只需要很少的努力即可使用。然而,患有运动障碍的个体,例如被诊断为肌萎缩侧索硬化症(ALS)或瘫痪中风患者,在自主性和对此类设备的控制方面可能会受到严重挑战。

尽管受到不同条件的限制,但眼睛通常是最后一个受到影响的器官,因此,基于眼动的人机界面(HCI)系统可以为此类智能系统提供替代通信通道,使患有这些条件的个人更加独立,提高生活质量[1]。

近年来,这种基于眼睛的人机交互系统已被广泛开发,使用基于视频眼球成像(VOG)的技术,它使用相机和图像处理算法来跟踪用户的眼球姿势(眼睛位姿)。尽管基于VOG的技术比基于眼电图(EOG)的技术具有更好的分辨率,但它们在计算上要求很高,易受照明条件的影响,对用户的移动很敏感,并且通常还需要外部照明源。替代眼动记录技术包括红外反射眼图,通常仅限于记录水平眼动;或者巩膜搜索线圈技术,这是一种半侵入性技术,因为它要求用户佩戴带有嵌入式线圈的隐形眼镜[2]。

另一方面,EOG通过捕捉人眼产生的电活动,可以为这些技术提供一个很好的替代解决方案,人眼的行为类似于电偶极,其正负极分别位于角膜和视网膜。事实上,这会产生0.4–1.0 mV范围内的电位差,称为视网膜角电位(CRP),从而产生电场。具体来说,EOG使用一组基于凝胶电极非侵入性地捕捉CRP产生的电活动,该电极附着在眼睛周围眶周位置的面部[2,3]。

 ubiquitous,无处不在。

mobility impairments,

活动障碍,

an alternative communication channel

替代通信信道

eye movement-based human–computer interface (HCI) system

基于眼动的人机界面(HCI)系统

last organs

最后的器官

a better resolution

更好的分辨率

susceptible to

易受

sensitive to

敏感于

normally require

通常需要

create a potential difference

产生电位差

the corneo-retinal potential (CRP)

视网膜角电位(CRP)

creates an electrical field.

创建电场。

 这项工作涉及到使用EOG信号与虚拟键盘应用进行交互。最先进的基于EOG的虚拟键盘通常要求用户进行重复的上、下、左、右和可能的斜视运动,以离散的固定大小的步骤在图标上盘旋[1,4,5],或者通过从屏幕中心向放置在外围的一组图标进行眼球运动来进行后续的图标选择,以抄写每个字符[6,7]。相比之下,拟议的虚拟键盘允许用户从屏幕上的任何位置访问任何图标。具体来说,这是通过模拟EOG信号中眼球运动的电压-角度关系来实现的,以允许直接估计受试者的扫视角位移,而不是简单地检测扫视的方向;因此,受试者可以在一个步骤中从一个目标移动到最终目标目的地,从而消除了必须通过中间位置或从屏幕上的中心位置重复发起眼球运动的限制。拟议的虚拟键盘也是异步控制的,因此不需要在提示间隔内执行眼动[6,7]。具体来说,这是通过提出一种新技术来实现的,该技术通过实时处理EOG信号来检测用户的扫视运动并将其与眨眼区分开来。还允许用户执行检测到的特定眨眼序列,以解决Midas触摸问题,这是文献中通常忽略的一个方面。

perform repetitive

重复执行

oblique saccadic movements

斜扫视运动

hover over icons in discrete fixed-sized steps

将光标悬停在离散的固定大小的图标上

saccadic angular displacement

扫视角位移

intermediary locations

中间位置

within cued intervals

在提示间隔内

in the literature.

在文献中。

在文献中,EOG信号中眼球运动的电压-角度关系通常通过分别分析水平和垂直EOG分量来建模,特别是通过对每个EOG分量采用一个模型来分别建模水平和垂直方向上的注视角度和EOG电位之间的关系[8-10]。然而࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值