什么是计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,指用摄像机和电脑代替人眼对目标进行识别、跟踪和测量等计算机视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给一起检测的图像。
一些需要了解的概念
·图像
图像深度:存储每个像素的位数(bits)
像素占用的位数越多,表现的颜色越多
图片格式与压缩:常见的图片格式JPEG,PNG,BMP等本质上都是图片的一种压缩编码方式
·视频
视频是由许多张图片有序构成,视频中的每张图片称为“帧(frame)”。压缩后的视频,会采取各种算法减少数据的容量,其中IPB就是最常见的。
I帧:表示关键帧,可以理解为这一幅画面的完整保留;解码时只需要本帧数据就可以完成(因为包含完整画面)
P帧:表示的是这一帧跟之前的一个关键帧(或P帧)的差别,解码时需要用之前缓存的画面叠加上本帧定义的差别,生成最终画面。(也就是差别帧,P帧没有完整画面数据,只有与前一帧画面差别的数据)
B帧:表示双向差别帧,记录的本帧与前后帧的差别(具体比较复杂,有4种情况),换言之,要解码B帧,不仅要取得之前的缓存画面,还要解码之后的画面,要通过前后画面与本帧数据的叠加取得最终的画面。B帧压缩率高,但是解码比较麻烦。
码率:数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒
帧率:在一秒钟时间里传输的图片的帧数,也可以理解为图形处理器每秒钟刷新的次数。
分辨率:影响图像大小,与图像大小成正比;分辨率越高,图像越大;分辨率越低,图像越小。
清晰度:
在码率一定的情况下,分辨率与清晰度成反比关系:分辨率越高,图像越不清晰,分辨率越低,图像越清晰 。