多相机人体三维姿态捕捉

传统的光学或惯性动作捕捉设备高昂价格阻碍其普及,计算机视觉动作捕捉技术因此受到关注。尽管存在二维信息恢复三维信息的挑战,多相机联合的动作捕捉技术通过解决相机标定、时间同步、关键点提取等问题,实现三维骨骼坐标求解和滤波优化。本文探讨了具体解决步骤,包括相机空间位置标定、时间同步和三维坐标求解,并提到使用OpenPose等算法提取关键点,以及应用滤波器和人体模型进行优化。
摘要由CSDN通过智能技术生成

传统的光学或惯性动作捕捉设备由于价格昂贵,很难走进民用。但伴随短视频的兴起,中短篇动画制作的需求猛增。此外,游戏、影视行业也对低成本动作捕捉有着强烈的需求。于是便催生了价格低廉的计算机视觉动作捕捉技术。

 

学术界对从视频中提取三维的人体姿态研究成果颇丰。但由于存在系统性不足:二维信息恢复三维信息,本身便缺秩。即使是运用个人人体模型的先验,也很难准确的捕捉人体动作。即便是重投影回视频后看起来效果不错,也无法在垂直视频方向(即深度方向)达到理想情况。

为解决这个问题,多相机联合的动作捕捉技术便应运而生。主要需要解决以下几个问题:1.相机空间位置标定2.相机录制时间同步3.每个视角二维关键点提取4.三维骨骼坐标求解5.滤波,优化,套人体模型。

解决步骤如下:

1.相机空间位置标定:传统的棋盘格标定算法在这个场景下面临两大挑战,一是距离较远,二是相机与棋盘格的夹角较大,常常误识别。解决策略有两个,一是制作立体的标定物,二是将重写标定算法,手动选点。

2.普通的USB相机时间同步能控制在1ms以内。用ffmpeg多线程录制或OpenCV都可以。

3.二维关键点提取,传统的OpenPose或者Hrnet、mmpose都可以。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 13
    评论
OpenCV(开源计算机视觉库)是一个开源计算机视觉和机器学习软件库。OpenCV的构建旨在为计算机视觉应用程序提供通用的基础结构,并加速在商业产品中使用机器感知。作为BSD许可的产品,OpenCV使企业可以轻松地使用和修改代码。 该库具有2500多种优化算法,其中包括一整套经典和最新的计算机视觉和机器学习算法。这些算法可用于检测和识别人脸,识别对象,对视频中的人为行为进行分类,跟踪摄像机的运动,跟踪运动的对象,提取对象的3D模型,从立体摄像机生成3D点云,将图像拼接在一起以产生高分辨率整个场景的图像,从图像数据库中查找相似的图像,从使用闪光灯拍摄的图像中消除红眼,跟随眼睛的运动,识别风景并建立标记以将其与增强现实叠加在一起等。OpenCV拥有超过4.7万人的用户社区,下载量估计超过1800万。该库在公司,研究小组和政府机构中得到广泛使用。 除了使用该库的Google,Yahoo,Microsoft,Intel,IBM,Sony,Honda,Toyota之类的知名公司外,还有许多应用创业公司,Applied Minds,VideoSurf和Zeitera等都在广泛使用OpenCVOpenCV的部署用途包括将街景图像拼接在一起,检测以色列监视视频中的入侵,监视中国的矿山设备,帮助机器人在Willow Garage导航和拾取物体,检测欧洲游泳池溺水事故,在西班牙和纽约,在土耳其检查跑道上的碎屑,检查世界各地工厂产品上的标签,然后在日本进行快速面部识别。 它具有C ++,Python,Java和MATLAB接口,并支持Windows,Linux,Android和Mac OS。OpenCV主要倾向于实时视觉应用,并在可用时利用MMX和SSE指令。 目前,正在积极开发功能齐全的CUDA和OpenCL接口。有500多种算法,而构成或支持这些算法的功能大约是其10倍。OpenCV用C ++原生编写,并具有可与STL容器无缝配合的模板化接口。
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值