一. 视觉
人的视觉主要分为光觉、形觉、色觉、立体觉和运动觉
我们的视杆细胞决定着亮度的感知,视锥细胞决定着色彩的感知
二. 图像感知和获取
图像传感器主要有CCD(Charge-Coupled Device)和CMOS(Complementary Metal-Oxide_Semiconductor)
他们的基本组成单元都是MOS(Metal-Oxide Semiconductor, 金属-氧化半导体)
CMOS在2009年后大规模应用至今,主要是因为其成本低,并且可以随着半导体的发展而提升
三. 取样和量化
图像的数字化包括采样和量化两个过程
采样主要是让图像在空间坐标(x, y)上离散
量化主要是让像素值即幅值f(x, y)离散
-
采样
(1)采样步骤:把一幅连续图像在空间上分割成M×N个网格,每个网格对应为一个像素点,用一亮度值表示。
采样间隔越大,像素越低,空间分辨率越低,质量越低,但数据量越小,反之,质量越好,数据量越大
需要注意的是:采样是在x, y两个方向上进行的,在采样完成后,虽然空间上离散了,但亮度还是连续分布的
(2)采样定理:从采样点精确恢复原图所需的最小采样点数量,即个采样点在水平和垂直方向的最大间隔
-
量化
(1)量化步骤:使连续信号的幅度用有限级的数字表示,决定了图像的幅度分辨率。量化级数越多,灰度层次越丰富,图像质量越好,数据量越大;反之,图像质量越差,数据量越小,会出现假轮廓现象。
(2)量化方法
均匀量化:等间隔分层,层数越多,量化误差越小
非均匀量化:以视觉特性为基础,亮度值急剧变化出,粗分层,亮度值平缓变化处,细分层;以统计特性为基础,亮度值出现概率大的地方,细分层,亮度值出现概率小的地方,粗分层。
非均匀量化法的比特数少且可以减小量化误差,但计算量大。 -
图像的上采样和下采样
上采样(upsampling):放大图像
需要对图像进行插值:最近邻插值或双线性插值
最近邻插值:选择距离最近的像素的灰度值,优点是简单快速,但灰度不连续,会产生马赛克效应
双线性插值:由它附近2×2区域4个邻近像素加权平均计算得出,优点是充分考虑相邻各点特征,但由于灰度平滑,细节退化,轮廓模糊。同时若是四个像素点灰度值差过大,效果不好
下采样(subsampling/downsampling):缩小图像,使图像符合现实区域大小或生成对应图像缩略图