OpenCV 【十九】图像金字塔/基本的阈值操作/实现自己的线性滤波器

目录

1.part one 图像金字塔

1.1原理

1.1.1图像金字塔

1.1.2高斯金字塔

1.2代码

1.3运行结果

2.part two 基本的阈值操作¶

2.1原理

2.1.1阈值化的类型:

2.1.2阈值类型1:二进制阈值化

2.1.3阈值类型2:反二进制阈值化

2.1.4阈值类型3:截断阈值化

2.1.5阈值类型4:阈值化为0

2.1.6阈值类型5:反阈值化为0

2.2代码

2.3运行结果

3.part three 实现自己的线性滤波器

3.1原理

3.1.1卷积

3.1.2核是什么?

3.1.3如何用核实现卷积?

3.2代码

3.3运行结果


 

1.part one 图像金字塔

1.1原理

  • 当我们需要将图像转换到另一个尺寸的时候, 有两种可能:

    1. 放大 图像 或者

    2. 缩小 图像。

  • 尽管OpenCV 几何变换 部分提供了一个真正意义上的图像缩放函数(resize, 在以后的教程中会学到),不过在本篇我们首先学习一下使用 图像金字塔 来做图像缩放, 图像金字塔是视觉运用中广泛采用的一项技术。

1.1.1图像金字塔

  • 一个图像金字塔是一系列图像的集合 - 所有图像来源于同一张原始图像 - 通过梯次向下采样获得,直到达到某个终止条件才停止采样。

  • 有两种类型的图像金字塔常常出现在文献和应用中:

    • 高斯金字塔(Gaussian pyramid): 用来向下采样

    • 拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像重建上层未采样图像

1.1.2高斯金字塔

  • 想想金字塔为一层一层的图像,层级越高,图像越小。

     

  • 每一层都按从下到上的次序编号, 层级 (i+1) (表示为 G_{i+1} 尺寸小于层级 i (G_{i}))。

  • 为了获取层级为 (i+1) 的金字塔图像,我们采用如下方法:

    • G_{i} 与高斯内核卷积:

      \frac{1}{16} \begin{bmatrix} 1 & 4 & 6 & 4 & 1  \\ 4 & 16 & 24 & 16 & 4  \\ 6 & 24 & 36 & 24 & 6  \\ 4 & 16 & 24 & 16 & 4  \\ 1 & 4 & 6 & 4 & 1 \end{bmatrix}

    • 将所有偶数行和列去除。

  • 显而易见,结果图像只有原图的四分之一。通过对输入图像 G_{0} (原始图像) 不停迭代以上步骤就会得到整个金字塔。

  • 以上过程描述了对图像的向下采样,如果将图像变大呢?:

    • 首先,将图像在每个方向扩大为原来的两倍,新增的行和列以0填充(0)

    • 使用先前同样的内核(乘以4)与放大后的图像卷积,获得 “新增像素” 的近似值。

  • 这两个步骤(向下和向上采样) 分别通过OpenCV函数 pyrUppyrDown 实现, 我们将会在下面的示例中演示如何使用这两个函数。

 

1.2代码

#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <math.h>
#include <stdlib.h>
#include <stdio.h>
​
using namespace cv;
​
/// 全局变量
Mat src, dst, tmp;
char* window_name = "Pyramids Demo";
​
​
/**
 * @函数 main
 */
int main( int argc, char** argv )
{
  /// 指示说明
  printf( "\n Zoom In-Out demo  \n " );
  printf( "------------------ \n" );
  printf( " * [u] -> Zoom in  \n" );
  printf( " * [d] -> Zoom out \n" );
  printf( " * [ESC] -> Close program \n \n" );
​
  /// 测试图像 - 尺寸必须能被 2^{n} 整除
  src = imread( "../images/chicky_512.jpg" );
  if( !src.data )
    { printf(" No data! -- Exiting the program \n");
      return -1; }
​
  tmp = src;
  dst = tmp;
​
  /// 创建显示窗口
  namedWindow( window_name, CV_WINDOW_AUTOSIZE );
  imshow( window_name, dst );
​
  /// 循环
  while( true )
  {
    int c;
    c = waitKey(10);
​
    if( (char)c == 27 )
      { break; }
    if( (char)c == 'u' )
      { pyrUp( tmp, dst, Size( tmp.cols*2, tmp.rows*2 ) );
        printf( "** Zoom In: Image x 2 \n" );
      }
    else if( (char)c == 'd' )
     { pyrDown( tmp, dst, Size( tmp.cols/2, tmp.rows/2 ) );
       printf( "** Zoom Out: Image / 2 \n" );
     }
​
    imshow( window_name, dst );
    tmp = dst;
  }
  return 0;
}

 

1.3运行结果

 

 

2.part two 基本的阈值操作

2.1原理

  • 最简单的图像分割的方法。

  • 应用举例:从一副图像中利用阈值分割出我们需要的物体部分(当然这里的物体可以是一部分或者整体)。这样的图像分割方法是基于图像中物体与背景之间的灰度差异,而且此分割属于像素级的分割。

  • 为了从一副图像中提取出我们需要的部分,应该用图像中的每一个像素点的灰度值与选取的阈值进行比较,并作出相应的判断。(注意:阈值的选取依赖于具体的问题。即:物体在不同的图像中有可能会有不同的灰度值。

  • 一旦找到了需要分割的物体的像素点,我们可以对这些像素点设定一些特定的值来表示。(例如:可以将该物体的像素点的灰度值设定为:‘0’(黑色),其他的像素点的灰度值为:‘255’(白色);当然像素点的灰度值可以任意,但最好设定的两种颜色对比度较强,方便观察结果)。

    Threshold simple example

    2.1.1阈值化的类型:

    • OpenCV中提供了阈值(threshold)函数: threshold

    • 这个函数有5种阈值化类型,在接下来的章节中将会具体介绍。

    • 为了解释阈值分割的过程,我们来看一个简单有关像素灰度的图片,该图如下。该图中的蓝色水平线代表着具体的一个阈值。

      Threshold Binary

    2.1.2阈值类型1:二进制阈值化

    • 该阈值化类型如下式所示:

      \texttt{dst} (x,y) =  \fork{\texttt{maxVal}}{if $\texttt{src}(x,y) > \texttt{thresh}$}{0}{otherwise}

    • 解释:在运用该阈值类型的时候,先要选定一个特定的阈值量,比如:125,这样,新的阈值产生规则可以解释为大于125的像素点的灰度值设定为最大值(如8位灰度值最大为255),灰度值小于125的像素点的灰度值设定为0。

    •  

      Threshold Binary

    2.1.3阈值类型2:反二进制阈值化

    • 该阈值类型如下式所示:

      \texttt{dst} (x,y) =  \fork{0}{if $\texttt{src}(x,y) > \texttt{thresh}$}{\texttt{maxVal}}{otherwise}

    • 解释:该阈值化与二进制阈值化相似,先选定一个特定的灰度值作为阈值,不过最后的设定值相反。(在8位灰度图中,例如大于阈值的设定为0,而小于该阈值的设定为255)。

      Threshold Binary Inverted

    2.1.4阈值类型3:截断阈值化

    • 该阈值化类型如下式所示:

      \texttt{dst} (x,y) =  \fork{\texttt{threshold}}{if $\texttt{src}(x,y) > \texttt{thresh}$}{\texttt{src}(x,y)}{otherwise}

    • 解释:同样首先需要选定一个阈值,图像中大于该阈值的像素点被设定为该阈值,小于该阈值的保持不变。(例如:阈值选取为125,那小于125的阈值不改变,大于125的灰度值(230)的像素点就设定为该阈值)。

      Threshold Truncate

    2.1.5阈值类型4:阈值化为0

    • 该阈值类型如下式所示:

      \texttt{dst} (x,y) =  \fork{\texttt{src}(x,y)}{if $\texttt{src}(x,y) > \texttt{thresh}$}{0}{otherwise}

    • 解释:先选定一个阈值,然后对图像做如下处理:1 像素点的灰度值大于该阈值的不进行任何改变;2 像素点的灰度值小于该阈值的,其灰度值全部变为0。

      Threshold Zero

    2.1.6阈值类型5:反阈值化为0

    • 该阈值类型如下式所示:

      \texttt{dst} (x,y) =  \fork{0}{if $\texttt{src}(x,y) > \texttt{thresh}$}{\texttt{src}(x,y)}{otherwise}

    • 解释:原理类似于0阈值,但是在对图像做处理的时候相反,即:像素点的灰度值小于该阈值的不进行任何改变,而大于该阈值的部分,其灰度值全部变为0。

      Threshold Zero Inverted

2.2代码

#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <stdlib.h>
#include <stdio.h>
​
using namespace cv;
​
/// 全局变量定义及赋值
​
int threshold_value = 0;
int threshold_type = 3;;
int const max_value = 255;
int const max_type = 4;
int const max_BINARY_value = 255;
​
Mat src, src_gray, dst;
char* window_name = "Threshold Demo";
​
char* trackbar_type = "Type: \n 0: Binary \n 1: Binary Inverted \n 2: Truncate \n 3: To Zero \n 4: To Zero Inverted";
char* trackbar_value = "Value";
​
/// 自定义函数声明
void Threshold_Demo( int, void* );
​
/**
 * @主函数
 */
int main( int argc, char** argv )
{
  /// 读取一副图片,不改变图片本身的颜色类型(该读取方式为DOS运行模式)
  src = imread( argv[1], 1 );
​
  /// 将图片转换成灰度图片
  cvtColor( src, src_gray, CV_RGB2GRAY );
​
  /// 创建一个窗口显示图片
  namedWindow( window_name, CV_WINDOW_AUTOSIZE );
​
  /// 创建滑动条来控制阈值
  createTrackbar( trackbar_type,
                  window_name, &threshold_type,
                  max_type, Threshold_Demo );
​
  createTrackbar( trackbar_value,
                  window_name, &threshold_value,
                  max_value, Threshold_Demo );
​
  /// 初始化自定义的阈值函数
  Threshold_Demo( 0, 0 );
​
  /// 等待用户按键。如果是ESC健则退出等待过程。
  while(true)
  {
    int c;
    c = waitKey( 20 );
    if( (char)c == 27 )
      { break; }
   }
​
}
​
​
/**
 * @自定义的阈值函数
 */
void Threshold_Demo( int, void* )
{
  /* 0: 二进制阈值
     1: 反二进制阈值
     2: 截断阈值
     3: 0阈值
     4: 反0阈值
   */
​
  threshold( src_gray, dst, threshold_value, max_BINARY_value,threshold_type );
​
  imshow( window_name, dst );
}

 

2.3运行结果

3.part three 实现自己的线性滤波器

3.1原理

3.1.1卷积

高度概括地说,卷积是在每一个图像块与某个算子(核)之间进行的运算。

3.1.2核是什么?

核说白了就是一个固定大小的数值数组。该数组带有一个 锚点 ,一般位于数组中央。

kernel example

3.1.3如何用核实现卷积?

假如你想得到图像的某个特定位置的卷积值,可用下列方法计算:

  1. 将核的锚点放在该特定位置的像素上,同时,核内的其他值与该像素邻域的各像素重合;

  2. 将核内各值与相应像素值相乘,并将乘积相加;

  3. 将所得结果放到与锚点对应的像素上;

  4. 对图像所有像素重复上述过程。

用公式表示上述过程如下:

H(x,y) = \sum_{i=0}^{M_{i} - 1} \sum_{j=0}^{M_{j}-1} I(x+i - a_{i}, y + j - a_{j})K(i,j)

幸运的是,我们不必自己去实现这些运算,OpenCV为我们提供了函数 filter2D

3.2代码

  • 载入一幅图像

  • 对图像执行 归一化块滤波器 。举例来说,如果该滤波器核的大小为 size = 3 ,则它会像下面这样:

    K = \dfrac{1}{3 \cdot 3} \begin{bmatrix} 1 & 1 & 1  \\ 1 & 1 & 1  \\ 1 & 1 & 1 \end{bmatrix}

    程序将执行核的大小分别为3、5、7、9、11的滤波器运算。

  • 该滤波器每一种核的输出将在屏幕上显示500毫秒

    #include "opencv2/imgproc/imgproc.hpp"
    #include "opencv2/highgui/highgui.hpp"
    #include <stdlib.h>
    #include <stdio.h>
    ​
    using namespace cv;
    ​
    /** @函数main */
    int main ( int argc, char** argv )
    {
      /// 声明变量
      Mat src, dst;
    ​
      Mat kernel;
      Point anchor;
      double delta;
      int ddepth;
      int kernel_size;
      char* window_name = "filter2D Demo";
    ​
      int c;
    ​
      /// 载入图像
      src = imread( argv[1] );
    ​
      if( !src.data )
      { return -1; }
    ​
      /// 创建窗口
      namedWindow( window_name, CV_WINDOW_AUTOSIZE );
    ​
      /// 初始化滤波器参数
      anchor = Point( -1, -1 );
      delta = 0;
      ddepth = -1;
    ​
      /// 循环 - 每隔0.5秒,用一个不同的核来对图像进行滤波
      int ind = 0;
      while( true )
        {
          c = waitKey(500);
          /// 按'ESC'可退出程序
          if( (char)c == 27 )
            { break; }
    ​
          /// 更新归一化块滤波器的核大小
          kernel_size = 3 + 2*( ind%5 );
          kernel = Mat::ones( kernel_size, kernel_size, CV_32F )/ (float)(kernel_size*kernel_size);
    ​
          /// 使用滤波器
          filter2D(src, dst, ddepth , kernel, anchor, delta, BORDER_DEFAULT );
          imshow( window_name, dst );
          ind++;
        }
    ​
      return 0;
    }

    3.3运行结果

 

 

3.3运行结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大江东去浪淘尽千古风流人物

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值