关于可见光摄像机与机器视觉的科普

本文介绍了机器视觉中的核心概念,包括卷帘快门和全局快门的工作原理及其在机器人状态估计中的应用。还探讨了像素、色深、景深、FOV(视场角)、焦距、变倍和聚焦等关键参数,以及光流和阴影对成像的影响。此外,提到了帧率在不同应用场景中的重要性,并简要提及了机器视觉未来可能涉及的其他技术领域。
摘要由CSDN通过智能技术生成

今天写一篇简单的,周末适合放松心情和锻炼

重点描述和机器视觉研究强相关的部分

CV: Computer Vision 机器视觉的简称

如果要使用一台可见光摄像机,或将其应用于机器人状态估计,以下部分是很值得关注的

卷帘快门Rolling shutter:

快门以卷帘的方式进行曝光成像,需要一定的时间,如果一个相机成像是25帧,则表明其1秒钟可成像25次,平均每一帧图像的曝光成像时间是40毫秒。对高速运动物体拍摄时容易产生残影。在当前机器人状态估计学科中,这种缺陷可以部分由其他传感器补回。

全局快门Global shutter:

全局所有像元同时曝光,适合对运动物体的拍摄,在机器人状态估计中比较好用,因为特征点取得稳定。

像素:所有大家看到的图像其实都是由像素构成的,一般来说是正方形的组合,说一个相机多少多少像素其实用长*宽就能算出来了,一般比例是4:3或者16:9,比如1024x768就是标准4:3像素组合。

依葫芦画瓢,对应200万,400万,4k(1200万),8k(4800万)像素的相机大家很容易就能算出来。

色深

通常指的是红绿蓝(RGB)具体用数字表述的状态,红黄橙绿青蓝紫本身只是RGB通过数字混合体现的结果,比如大家如果打开一张图片,整体放大后会发现都是由一个一个像素构成的。

常见的色深有8bit(80-90年代的第一代电视游戏机红白机FC),16bit,32bit,64bit(目前的主流),越丰富的色深体现的色彩结构越好

景深:

爱好摄影的同学们会比较了解,表示相机能够清晰成像的距离与范围

举一个简单的例子,近视的同学景深比较靠近近距离,远视的同学景深在远处,视力正常的同学景深较大。通常广角相机景深较大,微距相机与长焦相机景深较小。

FOV(视场角)与焦距:

这个是可见光相机中非常重要的概念,FOV即Field of View,通常表述成像画面水平角/垂直角/对角线的三角度,表述可以看到的范围。 同样像素的相机能看到的范围越小越长焦,越大越广角。

焦距这个概念解释深了还是复杂的,用最简单的解释就是定义相机能看到的图像距离与范围的一种关键参数,在VSLAM和机器视觉中应用很深。 在x/y轴上通常有不同的表述如fx/fy,如果以后有志深化了解机器视觉的同学可以认真看下。

变倍与聚焦:

这个也是很常用和清晰的概念,变倍实际就是改变相机FOV的过程,从大家日常直观使用相机的情况下,其实很像是拉远/拉近,但是这只是直观上的感觉,因为你在这个过程中与目标物实际的距离并没有发生任何的变化。 所以在靶面像素不变的基础上,变倍实际改变的是FOV,将FOV变得越小则观察越远的目标,反之走向广角观察更大的范围。鹰眼就是类似的效果。

聚焦就是将画面的清晰度调整至正确的景深里。

光流与阴影

实际可见光成像中,对相机最大的干扰就是光流与阴影。举例如强光入射相机,同样的目标在阴影不一样时成像完全不同(就像女士自拍都需要打光达到更好的光流效果/消除阴影)。未来大家在可见光相机开发的过程中会无数次地遇到他们的干扰。

帧率

1秒钟能成像的数量,这是个重要参数。不过我们机器人的应用一般25-30帧足矣,大不了换全局相机呗。但是我们在工业生产和专用类机器视觉的帧率可以达到数百帧,在一些需要瞬间成像的领域甚至要数千/上万帧,比如在一些关键焊接的过程中,整个工序就是数十毫秒。

可见光机器视觉的重要概念和定义就讲这些,有问题可以提问。

机器视觉的世界广阔无垠,至于IR相机,热成像,不受光流阴影影响的其他相机,深度相机,太赫兹等以后再介绍,人类的眼睛是很弱小的。但各种各样的仿生视觉:鹰眼,猫眼,蛇眼,复眼。将我们的感知扩展到了越来越大的范围。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值