目录
1.part one 图像金字塔
1.1原理
-
当我们需要将图像转换到另一个尺寸的时候, 有两种可能:
-
放大 图像 或者
-
缩小 图像。
-
-
尽管OpenCV 几何变换 部分提供了一个真正意义上的图像缩放函数(resize, 在以后的教程中会学到),不过在本篇我们首先学习一下使用 图像金字塔 来做图像缩放, 图像金字塔是视觉运用中广泛采用的一项技术。
1.1.1图像金字塔
-
一个图像金字塔是一系列图像的集合 - 所有图像来源于同一张原始图像 - 通过梯次向下采样获得,直到达到某个终止条件才停止采样。
-
有两种类型的图像金字塔常常出现在文献和应用中:
-
高斯金字塔(Gaussian pyramid): 用来向下采样
-
拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像重建上层未采样图像
-
1.1.2高斯金字塔
-
想想金字塔为一层一层的图像,层级越高,图像越小。
-
每一层都按从下到上的次序编号, 层级 (表示为 尺寸小于层级 ())。
-
为了获取层级为 的金字塔图像,我们采用如下方法:
-
将 与高斯内核卷积:
-
将所有偶数行和列去除。
-
-
显而易见,结果图像只有原图的四分之一。通过对输入图像 (原始图像) 不停迭代以上步骤就会得到整个金字塔。
-
以上过程描述了对图像的向下采样,如果将图像变大呢?:
-
首先,将图像在每个方向扩大为原来的两倍,新增的行和列以0填充()
-
使用先前同样的内核(乘以4)与放大后的图像卷积,获得 “新增像素” 的近似值。
-
-
这两个步骤(向下和向上采样) 分别通过OpenCV函数 pyrUp 和 pyrDown 实现, 我们将会在下面的示例中演示如何使用这两个函数。
1.2代码
#include "opencv2/imgproc/imgproc.hpp" #include "opencv2/highgui/highgui.hpp" #include <math.h> #include <stdlib.h> #include <stdio.h> using namespace cv; /// 全局变量 Mat src, dst, tmp; char* window_name = "Pyramids Demo"; /** * @函数 main */ int main( int argc, char** argv ) { /// 指示说明 printf( "\n Zoom In-Out demo \n " ); printf( "------------------ \n" ); printf( " * [u] -> Zoom in \n" ); printf( " * [d] -> Zoom out \n" ); printf( " * [ESC] -> Close program \n \n" ); /// 测试图像 - 尺寸必须能被 2^{n} 整除 src = imread( "../images/chicky_512.jpg" ); if( !src.data ) { printf(" No data! -- Exiting the program \n"); return -1; } tmp = src; dst = tmp; /// 创建显示窗口 namedWindow( window_name, CV_WINDOW_AUTOSIZE ); imshow( window_name, dst ); /// 循环 while( true ) { int c; c = waitKey(10); if( (char)c == 27 ) { break; } if( (char)c == 'u' ) { pyrUp( tmp, dst, Size( tmp.cols*2, tmp.rows*2 ) ); printf( "** Zoom In: Image x 2 \n" ); } else if( (char)c == 'd' ) { pyrDown( tmp, dst, Size( tmp.cols/2, tmp.rows/2 ) ); printf( "** Zoom Out: Image / 2 \n" ); } imshow( window_name, dst ); tmp = dst; } return 0; }
1.3运行结果
2.part two 基本的阈值操作¶
2.1原理
-
最简单的图像分割的方法。
-
应用举例:从一副图像中利用阈值分割出我们需要的物体部分(当然这里的物体可以是一部分或者整体)。这样的图像分割方法是基于图像中物体与背景之间的灰度差异,而且此分割属于像素级的分割。
-
为了从一副图像中提取出我们需要的部分,应该用图像中的每一个像素点的灰度值与选取的阈值进行比较,并作出相应的判断。(注意:阈值的选取依赖于具体的问题。即:物体在不同的图像中有可能会有不同的灰度值。
-
一旦找到了需要分割的物体的像素点,我们可以对这些像素点设定一些特定的值来表示。(例如:可以将该物体的像素点的灰度值设定为:‘0’(黑色),其他的像素点的灰度值为:‘255’(白色);当然像素点的灰度值可以任意,但最好设定的两种颜色对比度较强,方便观察结果)。
2.1.1阈值化的类型:
-
OpenCV中提供了阈值(threshold)函数: threshold 。
-
这个函数有5种阈值化类型,在接下来的章节中将会具体介绍。
-
为了解释阈值分割的过程,我们来看一个简单有关像素灰度的图片,该图如下。该图中的蓝色水平线代表着具体的一个阈值。
2.1.2阈值类型1:二进制阈值化
-
该阈值化类型如下式所示:
-
解释:在运用该阈值类型的时候,先要选定一个特定的阈值量,比如:125,这样,新的阈值产生规则可以解释为大于125的像素点的灰度值设定为最大值(如8位灰度值最大为255),灰度值小于125的像素点的灰度值设定为0。
-
2.1.3阈值类型2:反二进制阈值化
-
该阈值类型如下式所示:
-
解释:该阈值化与二进制阈值化相似,先选定一个特定的灰度值作为阈值,不过最后的设定值相反。(在8位灰度图中,例如大于阈值的设定为0,而小于该阈值的设定为255)。
2.1.4阈值类型3:截断阈值化
-
该阈值化类型如下式所示:
-
解释:同样首先需要选定一个阈值,图像中大于该阈值的像素点被设定为该阈值,小于该阈值的保持不变。(例如:阈值选取为125,那小于125的阈值不改变,大于125的灰度值(230)的像素点就设定为该阈值)。
2.1.5阈值类型4:阈值化为0
-
该阈值类型如下式所示:
-
解释:先选定一个阈值,然后对图像做如下处理:1 像素点的灰度值大于该阈值的不进行任何改变;2 像素点的灰度值小于该阈值的,其灰度值全部变为0。
2.1.6阈值类型5:反阈值化为0
-
该阈值类型如下式所示:
-
解释:原理类似于0阈值,但是在对图像做处理的时候相反,即:像素点的灰度值小于该阈值的不进行任何改变,而大于该阈值的部分,其灰度值全部变为0。
-
2.2代码
#include "opencv2/imgproc/imgproc.hpp" #include "opencv2/highgui/highgui.hpp" #include <stdlib.h> #include <stdio.h> using namespace cv; /// 全局变量定义及赋值 int threshold_value = 0; int threshold_type = 3;; int const max_value = 255; int const max_type = 4; int const max_BINARY_value = 255; Mat src, src_gray, dst; char* window_name = "Threshold Demo"; char* trackbar_type = "Type: \n 0: Binary \n 1: Binary Inverted \n 2: Truncate \n 3: To Zero \n 4: To Zero Inverted"; char* trackbar_value = "Value"; /// 自定义函数声明 void Threshold_Demo( int, void* ); /** * @主函数 */ int main( int argc, char** argv ) { /// 读取一副图片,不改变图片本身的颜色类型(该读取方式为DOS运行模式) src = imread( argv[1], 1 ); /// 将图片转换成灰度图片 cvtColor( src, src_gray, CV_RGB2GRAY ); /// 创建一个窗口显示图片 namedWindow( window_name, CV_WINDOW_AUTOSIZE ); /// 创建滑动条来控制阈值 createTrackbar( trackbar_type, window_name, &threshold_type, max_type, Threshold_Demo ); createTrackbar( trackbar_value, window_name, &threshold_value, max_value, Threshold_Demo ); /// 初始化自定义的阈值函数 Threshold_Demo( 0, 0 ); /// 等待用户按键。如果是ESC健则退出等待过程。 while(true) { int c; c = waitKey( 20 ); if( (char)c == 27 ) { break; } } } /** * @自定义的阈值函数 */ void Threshold_Demo( int, void* ) { /* 0: 二进制阈值 1: 反二进制阈值 2: 截断阈值 3: 0阈值 4: 反0阈值 */ threshold( src_gray, dst, threshold_value, max_BINARY_value,threshold_type ); imshow( window_name, dst ); }
2.3运行结果
3.part three 实现自己的线性滤波器
3.1原理
3.1.1卷积
高度概括地说,卷积是在每一个图像块与某个算子(核)之间进行的运算。
3.1.2核是什么?
核说白了就是一个固定大小的数值数组。该数组带有一个 锚点 ,一般位于数组中央。
3.1.3如何用核实现卷积?
假如你想得到图像的某个特定位置的卷积值,可用下列方法计算:
-
将核的锚点放在该特定位置的像素上,同时,核内的其他值与该像素邻域的各像素重合;
-
将核内各值与相应像素值相乘,并将乘积相加;
-
将所得结果放到与锚点对应的像素上;
-
对图像所有像素重复上述过程。
用公式表示上述过程如下:
幸运的是,我们不必自己去实现这些运算,OpenCV为我们提供了函数 filter2D 。
3.2代码
-
载入一幅图像
-
对图像执行 归一化块滤波器 。举例来说,如果该滤波器核的大小为 ,则它会像下面这样:
程序将执行核的大小分别为3、5、7、9、11的滤波器运算。
-
该滤波器每一种核的输出将在屏幕上显示500毫秒
#include "opencv2/imgproc/imgproc.hpp" #include "opencv2/highgui/highgui.hpp" #include <stdlib.h> #include <stdio.h> using namespace cv; /** @函数main */ int main ( int argc, char** argv ) { /// 声明变量 Mat src, dst; Mat kernel; Point anchor; double delta; int ddepth; int kernel_size; char* window_name = "filter2D Demo"; int c; /// 载入图像 src = imread( argv[1] ); if( !src.data ) { return -1; } /// 创建窗口 namedWindow( window_name, CV_WINDOW_AUTOSIZE ); /// 初始化滤波器参数 anchor = Point( -1, -1 ); delta = 0; ddepth = -1; /// 循环 - 每隔0.5秒,用一个不同的核来对图像进行滤波 int ind = 0; while( true ) { c = waitKey(500); /// 按'ESC'可退出程序 if( (char)c == 27 ) { break; } /// 更新归一化块滤波器的核大小 kernel_size = 3 + 2*( ind%5 ); kernel = Mat::ones( kernel_size, kernel_size, CV_32F )/ (float)(kernel_size*kernel_size); /// 使用滤波器 filter2D(src, dst, ddepth , kernel, anchor, delta, BORDER_DEFAULT ); imshow( window_name, dst ); ind++; } return 0; }
3.3运行结果