基于aDNN的指语识别方法

原创于 2025-10-08 04:05:28 发布 · 897 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#指语识别 #深度神经网络 #OpenCV #DNN #听障人士

基于aDNN的静态字符环境中大曾根式指语实时识别方法的提案与实验结果

一、引言

在日本，《残疾人就业促进法》于2020年4月进行了修订。根据该法律，用人单位被要求雇佣残疾人。在各类残疾中，听力困难且无法说话的人通常被称为听障人士。

听障人士在工作场所通过口头交流进行沟通存在困难。因此，在各种工作场所中，有必要促进与听障人士的沟通和理解。然而，听障人士与非听障人士之间使用手语进行交流由于学习机会有限以及手语包含多种不同的表达方式而难以掌握。因此，日本企业需要提供更多促进手语理解的机会和方法。本文提出了一种支持学习用于日语表达的大曾根式指语的方法。通过实验对提出的方法在大曾根式指语部分字符识别中的性能进行了评估。

二、提出的方法

本节中，我们提出了一种方法。图1展示了该提出的方法的流程图。我们使用开源计算机视觉库（OpenCV）中的深度神经网络（DNN）模块，该模块是一种图像处理库，用于获取手指关节的关键点。为了识别大曾根式指语，提出的方法利用DNN获得的手指关节关键点进行识别。当手指关节相互接触时，将相互接触的手指关节关键点配对；否则，计算指尖与手指根部关节关键点之间的坐标差异以配对关键点。例如，如果DNN通过大曾根式指语识别出4个或5个手指，则对应有4组或5组关键点，此时计算这4组或5组关键点的坐标差异。此外，提出的方法允许摄像头与人之间的距离范围约为 0.2[m]到1.5[m]，以便计算手指关节关键点的坐标差异。由于提出的方法能够利用UVC摄像头对视频流数据中的手指关节关键点识别进行实时处理，因此也适用于动态大曾根式指语的识别。

示意图0