三维点云体素滤波python_秦学英三维物体的识别与跟踪记录笔记

本文是山东大学秦学英教授关于三维物体识别与跟踪的笔记,重点介绍了增强现实中物体识别与跟踪的重要性,以及基于三维模板的跟踪技术,如LineMod和SSD-6D。内容涵盖了平面标志、自然标志的识别方法,以及无纹理三维物体的跟踪挑战和解决方案,强调了实时性和鲁棒性在增强现实应用中的关键作用。
摘要由CSDN通过智能技术生成

关注CV视觉网,并设为星标,更新不错过

-------------------------------------------

简介

秦学英, 山东大学软件学院教授,博士生导师。主要从事增强现实中的计算机视觉、图像视频分析和处理等智能算法的研究。2001年12月获广岛大学工学博士学位,2003年初至浙江大学CAD&CG国家重点实验室工作,2008年至山东大学计算机学院,2009年获山东省自然科学杰出青年基金资助。近年来从事的主要研究工作包括,三维模板跟踪、物体的检测、识别与跟踪、深度图矫正和修复、虚实融合与场景重绘、肢体动态语义分析及虚实交互等。研究成果在SIGGRAPH Asia (ACM TOG), IEEE TIP, IEEE TVCG, VR, IEEE CVPR, ACM MM,Eurographics国际期刊和国际会议上发表。

网址 http://vr.sdu.edu.cn/info/1051/1140.htm

为什么要进行物体的识别与跟踪

增强现实的要素

•实时三维空间注册是增强现实的灵魂

•但是,实时性与空间注册的鲁棒性与精确性是非常困难的

•尤其是基于视觉的技术,面临了极具挑战性的计算问题

•摄像机跟踪、SLAM等技术解决了静态场景的空间注册问题

•在动态场景中或者需要采用实体驱动虚拟物体,应该怎么办呢?

对动态物体的实时空间注册,可以驱动物体进行交互

•空间的高精度注册能够产生良好的虚实混合的体验,但是对于具有柔性的物体,建立帧与帧之间的严格对应是非常困难的

•刚性物体是增强现实技术空间注册的首选,更容易实现实时鲁棒的三维注册效果

93c214375b1941cbe3aaf8c54c8b241d.png

三维空间注册技术

•基于平面标志的空间注册技术:预知标志图案

•人工标志:人工设计图案,一般为黑白图案

•自然标志:自然图像作为图案,一般具有丰富特征

•基于三维物体的空间注册技术:预知三维物体为刚体

•三维模型未知:利用表面纹理实现注册

•三维模型预知:利用三维模型的约束实现注册

动态物体的三维空间注册是通过识别与跟踪来实现的,因为物体的动态性常常是不可以预测的

•识别:在画面上检测到目标物体的位置,并识别其具体的类别,主要在初始帧以及跟踪失败时迅速恢复跟踪

•跟踪:在连续帧画面上,确定三维物体的位姿参数

空间3D实时注册是增强现实的核心技术

•增强现实是实时在线的技术

•不仅实时性很重要,时间延迟也要尽量缩减

主要的三维空间注册方式

•基于硬件的方式

•基于标志点空间坐标的方式

•基于平面标志的实时三维注册技术

•基于三维模板的实时三维注册技术

•基于视频的摄像机实时定标方式(SfM)

•同时定位与地图构建

基于平面标志的空间注册技术

应用

•人工标志

•自然标志

人工标志的定义

•人工标志是一种具有特别图案的预制二维标志物

•人工标志一般采用黑白图案

•人工标志物可以定义一个二维正交坐标系,通过左手或者右手法则,定义一个三维空间坐标系

•人工标志自动定义了一个二维平面

人工标志的识别与跟踪流程

•获取灰度图:图像二值化

•预处理:获取潜在的标志边框

•快速识别和快速丢弃

直接拒绝仅有几个像素的小型区域

通过测试候选区域的颜色分布是否具有两极性来判断

通过对物体中的“洞”进行计数来判断

通过候选区域内颜色跳变的次数来判断

•计算标志位姿

•图案匹配

自然标志的定义

•自然标志是一幅具有丰富特征的自然图像

•自然标志物同样可以定义一个二维正交坐标系,通过左手或者右手法则,定义一个三维空间坐标系

自然标志的识别与跟踪

•基于特征点的识别

•特征点提取

•特征点匹配

•单应性矩阵计算

•基于特征点的跟踪

•在局部空间上进行搜索匹配

cb787c0301894411481ec47bb50a856d.png

三维物体的识别与跟踪

•三维物体是真实世界物体存在的方式,由于比二维平面多了一个维度,因此其识别与跟踪变得更为复杂

•如果已知三维模板,这也定义了一个局部三维坐标空间

•在增强现实领域,三维物体的识别与跟踪是在生产实践中非常重要的组成

•该技术也是人机交互和机器人领域的核心技术

72f054a176fb012d384c69d2be544102.png

•三维物体检测是要从图像中定位兴趣物体的位置区域

•三维物体识别是从检测到的区域中识别具体的物体类别

•与一般的物体检测与识别问题的差异是,三维物体的检测与识别技术的区别主要体现在已知条件(常常已知三维物体的三维模型),或者检测与识别的目标(三维的包围盒,以及物体的大致姿态)

39a15dd931cc43251b089091285ceb5e.png

•主要的方法

•从图像的检测与识别算法中发展而来

•LineMod

•基于深度学习算法目前具有最佳的性能表现

•Fast RCNN,Faster RCNN, Mask RCNN; Yolo, SSD

•SSD-6D

•在增强现实应用中的主要目的

•初始化三维跟踪位姿

•从失败的三维跟踪中恢复

•由三维模板生成训练数据

•数据由不同视角下的渲染图像构成

•三维模板在渲染时的位姿提供了标签

999ce86a7db27600292970c375ce1b16.png

三维物体的实时跟踪

90a9cd75d207f40ee8990d4902c91c9c.png

三维物体的跟踪

•现有方法的分类

基于特征点的方法[Lepetit2009]

利用判别性强的特征点

不适用于无纹理或弱纹理物体

基于边缘的方法[Drummond2002, Wang2015]

利用物体的边缘轮廓

背景复杂时易受干扰

基于区域的方法[Prisacariu2012, Tjaden2017 ]

利用前背景颜色统计信息

前背景颜色统计信息相似时易受干扰

27d31fa1789b8304e9adc3929cf372c4.png

基于特征点的方法

•在三维物体为刚体的情形,等价于SfM问题,只是需要将问题局限在三维物体上,剔除背景的影响

•随着SLAM技术的进步,在三维物体的特征非常丰富的情况下,目前已经有较好的解决方案

•相对来说,算法比较成熟

算法特点

•三维物体的识别通过特征点匹配来实现,例如基于词袋的方法

•如果三维物体有丰富的特征,那么几何形状的先验信息不是必须的,因为通过SfM或者SLAM,可以重建物体的几何形状

•如果给出了三维物体形状的先验信息,那么可以预知三维物体上特征点的空间坐标,从而在特征匹配的过程中,直接确定特征点对应的三维空间坐标,这样,在位姿估计中计算更为简捷,鲁棒性更好

弱纹理或者无纹理三维物体

•有一类物体表面仅有非常微弱的纹理,或者根本缺乏纹理信息,会导致特征的缺失,无法进行特征的匹配,特别是人造物体

•为了提高算法的鲁棒性,一般给出三维物体的几何模型,以其作为先验条件,可以提高识别与跟踪的鲁棒性

基于三维模板的物体识别

•基于特征学习的方法:LineMod

•基于深度学习的方法:SSD-6D

基于三维模板的物体跟踪

•基于边缘的方法

•基于区域的方法

基于边缘的三维模板跟踪

95e9c3318a1bbb4f08ae140841bc01c6.png

基于边缘的三维模板跟踪:边缘距离场

基本想法

利用目标物体的边缘形状与三维物体的边缘匹配

利用距离场获得求导的解析性

优势

不用显式搜索3D-2D对应点

不用一维搜索线

基于边缘距离场的全局能量函数+粒子滤波+鲁棒估计

挑战性

物体自身的物理属性:缺少纹理、物体表面反光等

物体所处的环境:背景复杂、光照变化和遮挡等

基于边缘距离场的无纹理三维物体跟踪方法

新的基于边缘距离场的姿态优化算法

粒子滤波框架处理大的帧间运动

鲁棒估计算子处理部分遮挡

基于姿态验证和错误恢复的无纹理三维物体跟踪方法

边缘方向一致性验证与三维跟踪过程融合

错误检测与错误恢复

实时无纹理三维物体跟踪系统

利用前景背景颜色信息去除嘈杂边缘干扰

多尺度优化和运动模型,提升处理速度

总体流程

•原始图像中进行边缘提取,生成距离场

•三维物体预设一个三维位姿,按照预设姿态获得轮廓

b74a0a3938db67d7740a101a9bca0cc8.png

49a02a787719bcf9f43a77990cc34957.png

e8f5e8713e203332abd30490cd02de1d.png

粒子滤波

初始姿态远离真实姿态时,迭代优化收敛到局部最小值

特别是帧间运动较大时,因此使用粒子滤波增加初始姿态的分布范围

5d11b1cf52c8c2e0fd0c246ccee4a4f2.png

edaf01bc7ab3a455c981f36cecd6f393.png

基于快速模板匹配的错误恢复

dbc61bf9ecf96012c8872bd5ae18420f.png

三维物体跟踪的应用:装配指导

14327ddae1d723e94f22fb5d8897ac0e.png

讨论

•技术的成熟度

•平面标志的识别与跟踪技术已经成熟,广泛地应用于增强现实系统中

•基于模板的三维跟踪技术则尚需进一步的研究,尤其是无纹理的三维模板跟踪,在迅速移动和快速转动时,跟踪效果不佳

•技术应用的趋势

•无论是二维的跟踪还是三维的跟踪,都可以实现三维空间的实时注册,从而实现虚实物体的三维融合

•三维识别与跟踪在交互技术中有重要性

•三维识别与跟踪在机器人抓取等问题中有重要性

-------------------------------------------

a75d5d609bc2763dd6f338eaa03e065a.png

觉得有价值,点击在看,并分享,大家共同学习

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值