CVPR2023论文 连续手语识别解读

这篇论文介绍了利用Correlation Network进行连续手语识别的研究,通过相关性模块捕捉身体部位在不同帧间的运动轨迹。相关性模块计算相邻帧像素的亲密度,结合注意力机制,获取像素点的轨迹信息。文中还展示了在ONNX网络中的可视化结果。
摘要由CSDN通过智能技术生成

Continuous Sign Language Recognition with Correlation Network

Paper: https://arxiv.org/abs/2303.03202

Code: https://github.com/hulianyuyy/CorrNet

Correlation Module 相关性模块

手语是通过身体部位,如手,身体,头等部位来传达的,然而在不同帧中,身体部位所处的像素点并不是对齐的,所以我们建议在相邻帧中计算相关性图以便计算身体运动轨迹。

对于每个当前帧xt,其中的每个像素点代表了人体部位的特征值,如手,肘,头等。将当前帧与前后两帧放在一起,通过一系列计算,即可得到当前像素(i, j)与相邻帧像素的亲密度,具体操作如下:

参照图3,对于xt上的每一个像素,分别在前后两帧 K*K 的范围内进行计算,可以得到像素与像素之间的亲密度。

计算公式如下: 

此处非常类似于注意力机制

当前帧与相邻帧的每个像素点一一相乘,得到每一对像素点之间的亲密关系A,形状为HWSD

A(i, j, i' ,j')表示xt中某一像素(i, j)与xt+1中某一像素(i', j')的亲密关系

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值