计算机视觉(一):数字图像

这是一系列计算机视觉的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。
适用人群:计算机视觉初学者,转AI的开发人员。
编程语言:Python
参考书籍:《数字图像处理》 --冈萨雷斯
数字图像处理
书内图像下载地址

矢量图、位图

计算机的数字化图像分为两种类型,即位图和矢量图。

  1. 矢量图(vector):也叫做向量图,矢量图是根据几何特性来绘制图形,是用线段和曲线描述图像。矢量可以是一个点或一条线,矢量图只能靠软件生成,矢量图文件占用内在空间较小,因为这种类型的图像文件包含独立的分离图像,可以自由无限制的重新组合,故而不会失真。矢量图形格式,如AdobeIllustrator的*.AI、.EPS和SVG、AutoCAD的.dwg和dxf、Corel DRAW的*.cdr等。常用在标志设计、时尚商业插图,三维建模等;
  2. 位图(bitmap):也称为点阵图,它是由许许多多的点组成的,这些点被称为像素,故而有分辨率的概念。位图图像可以表现丰富的多彩变化并产生逼真的效果,很容易在不同软件之间交换使用,但它在保存图像时需要记录每一个像素的色彩信息,所以占用的存储空间较大,在进行旋转或缩放时会产生锯齿。位图的文件,如*.bmp、.pcx、.gif、.jpg、.tif、photoshop的*.psd等。常用在数码照片,计算机绘图,网页图片等。
    矢量图和位图

二值图像、灰度图像、彩色图像、索引图像

  1. 二值图像(Binary Image):即图像上的每一个像素只有两种可能的取值或灰度等级状态,0和1,0代表黑,1代表白,或者说0表示背景,而1表示前景。其保存也相对简单,每个像素只需要1Bit就可以完整存储信息。如果把每个像素看成随机变量,一共有N个像素,那么二值图有2的N次方种变化,而8位灰度图有255的N次方种变化,8位三通道RGB图像有255255255的N次方种变化。也就是说同样尺寸的图像,二值图保存的信息更少。二值图像通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储。
  2. 灰度图像(Gray Image):是每个像素只有一个采样颜色的图像,这类图像通常显示为从最暗黑色到最亮的白色的灰度,尽管理论上这个采样可以任何颜色的不同深浅,甚至可以是不同亮度上的不同颜色。灰度图像与黑白图像不同,在计算机图像领域中黑白图像只有黑色与白色两种颜色;但是,灰度图像在黑色与白色之间还有许多级的颜色深度。灰度图像经常是在单个电磁波频谱如可见光内测量每个像素的亮度得到的,用于显示的灰度图像通常用每个采样像素8位的非线性尺度来保存,这样可以有256级灰度(如果用16位,则有65536级)。 灰度图像灰度
  3. 彩色图像(Color Image):指RGB真彩色图像,通常包含三个通道的信息,每个像素通常是由红(R)、绿(G)、蓝(B)三个分量来表示的,分量介于[0,255]。RGB图像每一个像素的颜色值(由RGB三原色表示)直接存放在图像矩阵中,由于每一像素的颜色需由R、G、B三个分量来表示,M、N分别表示图像的行列数,三个M x N的二维矩阵分别表示各个像素的R、G、B三个颜色分量。
    彩色图像 RGB通道
  4. 索引图像(thumbnail):文件结构比较复杂,除了存放图像的二维矩阵外,还包括一个称之为颜色索引矩阵MAP的二维数组。MAP的大小由存放图像的矩阵元素值域决定,如矩阵元素值域为[0,255],则MAP矩阵的大小为256Ⅹ3,用MAP=[RGB]表示。MAP中每一行的三个元素分别指定该行对应颜色的红、绿、蓝单色值,MAP中每一行对应图像矩阵像素的一个灰度值,如某一像素的灰度值为64,则该像素就与MAP中的第64行建立了映射关系,该像素在屏幕上的实际颜色由第64行的[RGB]组合决定。索引图像一般用于存放色彩要求比较简单的图像,如Windows中色彩构成比较简单的壁纸多采用索引图像存放,如果图像的色彩比较复杂,就要用到RGB真彩色图像。

在以后的计算机视觉中,一般操作的都是RGB真彩色图像,或者为了研究方便,只针对一个通道进行研究,即灰度图像

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值