一.数字图像是什么
我们在计算机世界里,网络世界里看到图片都是数字图像,不管是哪种格式,bmp,jpg,png,统统都是二进制字节码放在内存中。计算机按指定的编解码规则将二进制字节读出来,通过显示器展示出图片。数字图像有很长的发展历史,从英美报纸行业开始,编码、解码、压缩、传输、存储、显示,各种技术蓬勃发展直到今天,出现了很多关于数字图像的概念。
二.openCV是什么
对数字图像进行处理当然可以从字节码级别开始处理,能这么做很厉害,但是太无聊,我们要做的工作是在像素矩阵的基础之上做点东西。openCV是个开源的处理图片的代码工具包,openCV可以直接把各种格式的图像直接读成多维矩阵,或者叫向量空间,每个像素就是这个空间中的一个向量,计算机视觉要从这个矩阵开始进行工作。除了openCV外,还有其他各种工具会用到。
三.图像通道是什么
数字图像和画在纸上的图片、光学胶卷曝光出来的照片不一样,要把图的内容存在计算机中并且能展示给人眼看。在图像数字化过程中,必然损失掉一些细节,图片以大量的像素点的形式记录在计算机上,我们可以用“分辨率”来描述像素的密集程度,也就是与实际画面接近的程度。我们把每一个像素作为一块单独的信息,以最原始的黑白图为例,每一个像素用8bit存储(0~ 255),代表256级不同的灰度,每个位置的像素点都有自己的不同程度的黑白灰,于是一整张黑白照片就被记录下来了。这里的为每个像素点记录灰度数据就叫通道,灰度图是单通道。
而一般的彩色图,每个像素点要记录RGB三个信息,所以这就是三通道,有的图还要在加上透明度信息,这就是四通道。
还有一种HSV三通道模型,分别是色调、饱和度、明度。
等等。
结论:数字图片中,像素的分量就是通道。可以以通道为单位,将每条通道可以单独拿出来处理。
四.图像预处理
传统的计算机视觉主要包括几个工作流程:图像预处理,特征值提取,特征表示,利用数据训练模型。
1、灰度图与灰度直方图
灰度图就是计算机中的黑白照片,每个像素只有一个通道,这个通道也叫灰度通道,数值是0~255,表示这个像素点是有多黑。
灰度直方图均衡化,通过调整像素改变直方图,可以使图片的对比度更高
2、噪声与滤波
数字图像由电信号保存和传递,所以不可避免会被噪声污染,左为原始图片,右为被噪声污染后。
滤波,就是对图片中的像素进行计算,降低噪声。有多种算法,例如均值滤波、高斯滤波、中值滤波等等。
3、阈值二值化
将灰度图处理为二值图,所有像素点只有两种可能0或255,例如文字识别的时候,文字的像素全处理为纯黑,纸张的颜色全处理为纯白。
五、图片特征描述
特征的提取和表示就是:通过提取图像的有用信息,并且丢弃无关信息来简化图像的表示。例如,尺度不变特征变换、方向梯度直方图。