图像是人们生活中生活体验最丰富的部分,但图像究竟是什么呢?对于图像的理解可以分为两个方面,“图”是物体透射光或者反射光的分布,“像”是人的视觉系统接受图后在大脑形成的印象或认识。通俗的说,“图”是客观存在的事物,“像”是一种人为的感受。
而数字图像处理是用计算机来处理图像,PS软件的使用,手机拍照美颜,人脸识别等等,都需要利用数字图像处理的知识来解决。
图像的形成
自然界的图像是模拟形式的,计算机无法直接处理,需要将自然界中的图像进行数字化处理之后,再传给计算机来处理。
数字化就是将模拟图像转化为数字图像的过程,包括扫描、采样、量化三个步骤。采样就是对图像空间的离散化处理,将图像分成一个一个的小像素,而量化就是对图像幅值的离散化处理,使图像像素的数值与有限数值范围中的某一个相对应。而采样点数和量化级数会直接影响分辨率,采样点数越多,量化级数越高,则图像分辨率越高,图像越清晰,但存储图像所需要的空间也就越大,这需要根据不同的情况来选择不同的分辨率,例如微信等软件发送图片时便可自己选择原图或者是压缩后的图片。
如下图所示,选择原图发送则图片体积大,发送慢,但更清晰。
图像的表示
图像数字化之后在计算机中其实就是一个数字矩阵,通常有三种表示形式,灰度图像,彩色图像,二值图像。
灰度图像用一个通道来表示,图像的灰度用像素值来表示,数值越大则图片越白。彩色图像常用三个通道来表示,分别是红绿蓝这三个通道,组成的是一个三维向量矩阵。而在计算机中常见的灰度或者红绿蓝的数值范围通常是0到255,这是因为图像的每个像素是使用8位来表示的,2^8=256。但这只是适合人类的彩色视觉辨别系统,其实还存在许多其他的范围,例如二值图像只有黑白两色,数值范围便只有0和1,而高级的摄像机或者卫星图片,为了提高图片的清晰度,会采用更大的范围。
在图像实际进行存储时,通常会转换成各种格式,常见的有JPG,PNG,GIF等。
- PNG(Portable Network Graphic Format),适合在网络上传输和打开,本来是想替代GIF格式,但是不支持动画。
- JPG(Joint Photographic Experts Group),是一种用有损压缩方式来去除冗余的数据,获得质量高,尺寸小,略有失真的图像,是目前最常用的图像格式,各种相机都是这个格式。
- BMP(位图,BitMap),这是图像未经压缩的原始数据,可以存储真彩色的图像数据。
- GIF(Graphics Interchange Format)是将多幅图像保存为一个图像文件,从而形成动画。采用无损压缩技术,即减少了文件的大小,有保证了图像的质量。
- PSD,TIF/TIFF,这些格式由一些公司为了自己的产品而研发的格式,需要用特定的软件打开。
颜色视觉
牛顿曾经利用三棱镜,将一束白光分解成为了不同的颜色。图像的颜色也是可以由其他的颜色混合而成的,最常见的颜色模型是RGB模型,由三原色红绿蓝组成了其他的颜色,因此我们常称它为加法混色模型,电脑或者电视机这样的显示设备便是采用这种颜色模型。
在印刷行业则是使用另一种颜色模型–CMY模型,它的原色分别是青色(Cyan)、品红(Magenta)、黄色(Yellow)这三种油墨色,与RGB正好互为补色,因此被叫做减色原色模型,而RGB可以与CMY通过相减来进行转换。实际的印刷中,由于染料的纯度,纯粹的黑色不能由其他三种原色混合得到,所以增加了一种黑色(Black),实际印刷使用的模型其实是CMYK模型。
其他的如YUV,YIQ,YCrCb这类,是将颜色的亮度分离开来,用Y表示亮度,用其他两个表示颜色,这类颜色模型通常用于电视广播等,它们与RGB颜色模型能够进行转换。
RGB和CMY都是面向硬件的,而HSV和HSI颜色模型则是面向用户的。HSV用色调(Hue)、饱和度(Saturation)和明度(Value)来描述彩色空间,它把图像的明度与颜色的两个本质特征–色度和饱和度分开,能够颜色光照对图像的影响,很好的弥补了RGB模型的缺点。HSI模型也是面向用户,I表示亮度(Intensity),与HSV相比,除了计算公式略有不同,其他几乎相似,也是面向用户的。
图像像素运算
对于某个像素,它可以有周围的近邻像素组成的领域。像素的上下左右位置的像素组成了该像素的4-领域,4个对角近邻像素组成D-领域,而4领域和D领域的像素共同组成了8领域。
像素 p(x,y) 的4邻域是:(x,y+1);(x+1,y);(x,y-1);(x-1,y)
像素 p(x,y) 的D邻域是:(x-1,y+1);(x+1,y+1);(x+1,y-1);(x-1,y-1)
像素 p(x,y) 的8邻域是:4邻域的点+D邻域的点
像素的连通性便是描述几个像素是否相连的重要概念。两个像素连通需要满足两个条件,一个是两个像素的位置是否相邻,另一个是两个像素的灰度值是否满足某种相似的准则。常见的连通方式有4连通,8连通,m连通。
4连通:p和q具有连通性
8连通:p和q具有连通性
m连通简单地说就是4连通和D连通的混合连通,但需要满足两个像素的四连通没有交集。
视觉错觉
对于图像的亮度而言,人的视觉系统通常与图像的亮度不是成正比的。奥地利物理学家马赫发现了一种亮度对比的视觉效应,称之为马赫带效用,这说的是人的视觉系统会在亮度变化的地方出现明亮或者黑暗的条纹。人的视觉通常会错过渐变,而能够抓住突变,甚至放大突变的亮度,这就是人眼对于突变亮度有着过度的响应。
而另一种视觉错觉则是同时对比错觉,人对某个区域的亮度感受并不仅仅取决于这个区域的亮度,而会受到周围亮度的对比,这类现象可以用近旁适应性来解释。如下图的中央圆形,即使你的大脑已经知道了两个颜色是一样的,但我们的眼睛感受总会认为右边的会更暗一点,
欢迎大家关注公众号“计算机视觉与机器学习”