为什么用视觉动捕方案进行动作捕捉,会容易出现模型抖动问题?其根源在于视觉动捕的技术路线。
众所周知,视觉动捕技术不同于传统的光学动捕、惯性动捕,是通过摄像头来对人体运动数据进行捕捉。
市面上做视觉动捕的采用的摄像头一般会分为2类,带深度信息的深度摄像头和不带深度信息的普通RGB摄像头。
今天带大家主要讨论一下基于单RGB摄像头的视觉动捕。
从技术流程看:
Step1:通过摄像头捕捉人体运动精准提取稳定的2D关键点
A:视觉动捕是用摄像头捕捉人体数据,相当于给运动的人体拍照片,再从拍到的照片上提取出人体的2D关键点。而在这个过程中会出现两个问题点:
1、为了使动作更加连贯流畅,通常1S内摄像头会拍摄很多张图像。但不是每一张图像提取的关键点都是准确的。
2、人体运动过程中某些动作会出现遮挡部分身体,导致难以准确提取遮挡部分的关键点。
在这两点原因的作用下,单RGB摄像头准确提取2D关键点成为技术难度之一。
Step2:通过2D点拟合计算出高精度3D信息
A:单RGB摄像头捕捉的关键点是2D的,而动捕是三维的ÿ