1. 计算机视觉
1.1. 定义
- 从数字图像中提取信息的科学领域
- 构建能理解图像内容的算法,并将其用于其他应用。
1.2. 图像处理基础
1.2.1. 颜色
- 颜色空间:RGB(属于线性颜色空间)、CIE-XYZ(属于线性颜色空间)、HSV(属于非线性颜色空间)。
- 白平衡:是将传感器接收到的图片数据调整至合适的呈现中性的颜色(灰、白等等)的过程。
相关算法:Von kries Method(Gray Card Method)、Gray World Assumption、Brightest Pixel Assumption.
1.2.2. 图像采样和量化
- 图像类型:
- 黑白图像:像素是黑色(0)或者白色(1)
- 灰阶图像:像素范围在0(黑色)~255(白色)
- 彩色图像:有多个颜色通道,每张图片可以在不同的颜色模型 (RGB, LAB, HSV) 上呈现,每个颜色通道值的范围取决于所选的颜色模型。
-
直方图(Image Histograms)
直方图用于测试灰度图的强一个特定的像素值 (0-255) 在图像中出现了几次。
1.2.3. 卷积和相关
-
卷积(Convolution):
可看作是加权求和的过程,使用到的图像区域中的每个像素分别于卷积核(权矩阵)的每个元素对应相乘,所有乘积之和作为区域中心像素的新值。
-
相关(Correlation):
等于卷积计算时内核没有翻转的结果。
-
区别:
-
卷积是一个积分,它表示当一个函数在另一个函数上移动的时候的重叠部分。也就是说,卷积是一个过滤操作。
-
相关比较了两个数据集的相似性。相关性计算了两个输入函 s 数相互移动时的相似性测量值。两个函数匹配都越高,它的结果值越大。也就是说,相关性是两个信号关联性的测量值。
-
-
共性:
- 都是线性的,即用每个像素的邻域的线性组合来代替这个像素。
- 都具有平移不变性(shift-invariant),即在图像的每个位置都执行相同的操作。
1.2.4. 滤波
1.2.4.1. 频率(frequency)
频率(frequency)是波动快慢的指标。图像就是色彩的波动:波动大,就是色彩急剧变化;波动小,就是色彩平滑过渡。
大多数图片既有高频成分又有低频成分,色彩剧烈变化的地方,就是图像的高频区域;色彩稳定平滑的地方,就是低频区域。
1.2.4.2. 滤波器(Filter)
定义:由特定公式导出的卷积核。
规则要求:
1)滤波器的大小应该是奇数,这样它才有一个中心,例如3x3,5x5或者7x7。有中心了,也有了半径的称呼,例如5x5大小的核的半径就是2。
2)滤波器矩阵所有的元素之和应该要等于1,这是为了保证滤波前后图像的亮度保持不变。当然了,这不是硬性要求了。
3)如果滤波器矩阵所有元素之和大于1,那么滤波后的图像就会比原图像更亮,反之,如果小于1,那么得到的图像就会变暗。如果和为0,图像不会变黑,但也会非常暗。
4)对于滤波后的结构,可能会出现负数或者大于255的数值。对这种情况,我们将他们直接截断到0和255之间即可。对于负数,也可以