AR算法原理在计算机视觉中的应用

2016年,一款名为《Pokémon GO》的游戏出现在大众视野,怒刷各大游戏排行榜。极具趣味性和科技感的AR技术效果瞬间火爆全球。接着AR技术被广泛用在各大互联网公司APP的营销场景中,其中最多的便是AR识别和追踪。但一段时间内,真正掌握核心技术的国内厂家并不多,对应出现了提供AR识别SDK小公司的创业机会。

那么,这些技术背后的原理是什么?本文会从图像处理、特征检测、特征点匹配、图像变换匹配和追踪算法等方面给你进行深入浅出的技术展现,让AR识别技术不再成为难以逾越的技术壁垒。最后也会跟大家聊聊,天猫营销平台技术,是如何探索新技术在营销领域的运用,与商业进行紧密结合的。


AR技术从来不是单独的一门学科领域,它是众多技术学科集成在一起的一个应用方向。如图所示,除了一些图像处理基础及AR硬件相关算法外,它所依托的最重要两个领域是计算机视觉和机器学习,而这背后就人工智能这个大领域。我们会以计算机视觉理论作为基础,来讲讲AR的技术。

1. 基础知识准备

首先科普两个基础知识,我们先来说说图像的表示和色彩模型。

二维图像模型,定义一个二维图像的模型表示成z = I(x, y),x、y为二维图像上的像素点坐标值,z为此像素点的色彩值,如果使用的是RGB色彩模型,那z值就是以红、绿、蓝三个值定义的数据,比如红色为(255,0,0)。一般图片处理很多采用单通道即灰度值,那就是0~255之间的一个表示灰度的值,彩色图片也可以由一定公式变换到灰度空间里。后续的图像算子操作(如卷积等)均是在此模型上进行相信数值计算。这个模型很简单,下面要介绍的一个模型就有点难了。

计算机视觉的最重要模型:透视照相机模型,也叫小孔摄像机模型。这个模型来源于真实世界的成像原理,从古人发现的小孔成像、到凸透镜成像、一直到人眼成像结构的发现。

人们从发现的原理中受到启发,确立了由4个坐标系组成的透视照相机模型。它描述了现实世界的物体从世界坐标系、相机坐标系、图像坐标系到像素坐标系之见转换的位置关系,并对应到多个矩阵的计算上。AR算法所用到的计算机视觉技术,很多都是现实世界的物体与图像平面上的变换(这里一般称为单应性变换,后文会用到),所以这个模型就成为了AR算法中最基本的模型,大家心里要这个概念。

AR算法的核心技术:识别追踪

AR算法有很多不同种类,其中目前在手机端使用的最重要的就是识别和追踪。基本上,去年以来的所有在手机APP上宣称的AR功能都离不开此技术。

如图我厂去年的一些营销活动,“全民扫钱”领优惠券、扫实物瓶子出现相关3D动画,识别标记图片找红包等,都使用了图像的识别或者追踪技术。

AR识别追踪的流程

AR识别追踪,根据所需识别的图像内容,大致分为两个技术流派:Marker based AR 以及MarkerLess AR。Marker识别是使用一个较简单的标识,通常是正方形并且四边都清晰可辨。这类识别算法相对简单,通常用模板匹配算法解决,效果也不错,此方面经典实现可以参考早期ARToolKit引擎的Marker识别流程。

随着进一步发展,人们逐渐喜欢用更复杂的图像来代替Marker,简单的识别技术已经不适应现有需求。于是就出现了更复杂更通用的MarkerLess AR的识别,我们下面主要说的就是这种技术。

MarkerLess AR的识别追踪主要分为特征点检测、图片识别和追踪(姿态估计)三个步骤。图片识别的过程又分为特征点匹配和图片相似度度量两步。

特征检测

图像局部特征检测作为计算机视觉领域的热点内容,这十几年里研究进展不断。考察此技术的大致发展历史,是从简单的角点特征提取一直到尺度不变、旋转不变的特征提取算法。图像的角点特征是最容易被检测出来的,但是,在不同尺度不同大小分辨率的图像上会不稳定,比如在小图片中找到的角点不一定在同一张图片的小尺寸图片上检测得出来。

另外,图片发生旋转后特征区域的角度发生变化&#x

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值