OpenCV学习第一天

最新推荐文章于 2024-08-12 20:28:17 发布

i_love_zxr1314

最新推荐文章于 2024-08-12 20:28:17 发布

阅读量239

点赞数

文章标签：机器学习

原文链接：https://github.com/datawhalechina/team-learning/blob/master/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89%E5%9F%BA%E7%A1%80%EF%BC%9A%E5%9B%BE%E5%83%8F%E5%A4%84%E7%90%86%EF%BC%88%E4%B8%8A%EF%BC%89/Task01%20%E5%9B%BE%E5%83%8F%E6%8F%92%E5%80%BC%E7%AE%97%E6%B

版权

这是我人生第一次写博客，也是学习OpenCV的第一天，欢迎大神们指教批评我这个小白。

OpenCV的介绍

一句话总结：他就是个很厉害的库函数。
那就来简单介绍一下什么是OpenCV：
OpenCV是一个用于图像处理、分析、机器视觉方面的开源函数库.
不管你是做科学研究，还是商业应用，opencv都能够作为你理想的工具库，由于，对于这两者，它全然是免费的。
该库採用C及C++语言编写，能够在windows, linux, mac OSX系统上面执行。该库的全部代码都经过优化，计算效率非常高，由于，它更专注于设计成为一种用于实时系统的开源库。opencv采用C语言进行优化，并且，在多核机器上面，其执行速度会更快。它的一个目标是提供友好的机器视觉接口函数，从而使得复杂的机器视觉产品能够加速面世。该库包括了横跨工业产品检测、医学图像处理、安防、用户界面、摄像头标定、三维成像、机器视觉等领域的超过500个接口函数。
同一时候，由于计算机视觉与机器学习密不可分，该库也包括了比較经常使用的一些机器学习算法。也许，非常多人知道，图像识别、机器视觉在安防领域有所应用。但，非常少有人知道，在航拍图片、街道图片（比如google street view）中，要严重依赖于机器视觉的摄像头标定、图像融合等技术。
近年来，在入侵检测、特定目标跟踪、目标检测、人脸检测、人脸识别、人脸跟踪等领域，opencv可谓大显身手，而这些，不过其应用的冰山一角。
现在，来自世界各地的各大公司、科研机构的研究人员，共同维护支持着opencv的开源库开发。这些公司和机构包括：微软，IBM，索尼、西门子、google、intel、斯坦福、MIT、CMU、剑桥…

摘自：https://blog.csdn.net/carson2005/article/details/5822149

下面来逐一介绍我学到的原理(比较深奥的)：

1.原理

1.1最近邻插值算法原理
最近邻插值，是指将目标图像中的点，对应到源图像中后，找到最相邻的整数点，作为插值后的输出。
在这里插入图片描述
如上图所示，目标图像中的某点投影到原图像中的位置为点P,此时易知， $f (P) = f (Q 11)$ .
一个例子：

如下图所示，将一幅3X3的图像放大到4X4，用 $f (x, y)$ 表示目标图像， $h (x, y)$ 表示原图像，我们有如下公式：

$\begin{array}{c} f(dst_{X}, dst_{Y}) = h(\frac{dst_{X}src_{Width}} {dst_{Width}}, \frac{dst_{Y}src_{Height}} {dst_{Height}}) \end{array}$

$\begin{array}{c} f(0,0)=h(0,0) \ f(0,1)=h(0,0.75)=h(0,1) \ f(0,2)=h(0,1.50)=h(0,2) \ f(0,3)=h(0,2.25)=h(0,2) \ ...\ \end{array}$

在这里插入图片描述

缺点：用该方法作放大处理时，在图象中可能出现明显的块状效应
在这里插入图片描述
** 1.2.双线性插值**
在讲双线性插值之前先看以一下线性插值，线性插值多项式为：

$f(x)=a_{1} x+a_{0}$

在这里插入图片描述
$y=y_{0}+\left(x-x_{0}\right) \frac{y_{1}-y_{0}}{x_{1}-x_{0}}=y_{0}+\frac{\left(x-x_{0}\right) y_{1}-\left(x-x_{0}\right) y_{0}}{x_{1}-x_{0}}$

双线性插值就是线性插值在二维时的推广,在两个方向上做三次线性插值，具体操作如下图所示：
在这里插入图片描述
令 $f (x ， y)$ 为两个变量的函数，其在单位正方形顶点的值已知。假设我们希望通过插值得到正方形内任意点的函数值。则可由双线性方程: $f (x, y) = a x + b y + c x y + d$

来定义的一个双曲抛物面与四个已知点拟合。

首先对上端的两个顶点进行线性插值得：

$f (x, 0) = f (0, 0) + x [f (1, 0) - f (0, 0)]$

类似地，再对底端的两个顶点进行线性插值有： $f (x, 1) = f (0, 1) + x [f (1, 1) - f (0, 1)]$

最后，做垂直方向的线性插值，以确定：

$f (x, y) = f (x, 0) + y [f (x, 1) - f (x, 0)]$

整理得：

$\begin{array}{l} f(x, y)=[f(1,0)-f(0,0)] x+[f(0,1)-f(0,0)] y \ +[f(1,1)+f(0,0)-f(0,1)-f(1,0)] x y+f(0,0) \end{array}$

1.3.映射方法

向前映射法

可以将几何运算想象成一次一个象素地转移到输出图象中。如果一个输入象素被映射到四个输出象素之间的位置，则其灰度值就按插值算法在4个输出象素之间进行分配。称为向前映射法，或象素移交影射。

注：从原图象坐标计算出目标图象坐标镜像、平移变换使用这种计算方法

向后映射法

向后映射法（或象素填充算法）是输出象素一次一个地映射回到输入象素中，以便确定其灰度级。如果一个输出象素被映射到4个输入象素之间，则其灰度值插值决定，向后空间变换是向前变换的逆。

注：从结果图象的坐标计算原图象的坐标

旋转、拉伸、放缩可以使用
解决了漏点的问题，出现了马赛克

2.代码实现（C++）

函数原型：

void cv::resize(InputArray src, OutputArray dst, Size dsize, double fx=0, double fy=0, int interpolation=INTER_LINEAR )

src:输入图像
dst:输出图像
dsize:输出图像尺寸
fx、fy:x,y方向上的缩放因子
INTER_LINEAR：插值方法，总共五种
    1. INTER_NEAREST - 最近邻插值法
    2. INTER_LINEAR - 双线性插值法（默认）
    3. INTER_AREA - 基于局部像素的重采样(resampling using pixel area relation)。对于图像抽取(image decimation)来说，这可能是一个更好的方法。但如果是放大图像时，它和最近邻法的效果类似。
    4. INTER_CUBIC - 基于4x4像素邻域的3次插值法
    5. INTER_LANCZOS4 - 基于8x8像素邻域的Lanczos插值

代码实践：

#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main(int argc, char* argv[])
{
	Mat img = imread("D:/image/yuner.jpg");
	if (img.empty())
	{
		cout << "无法读取图像" << endl;
		return 0;
	}

	int height = img.rows;
	int width = img.cols;
	// 缩小图像，比例为(0.2, 0.2)
	Size dsize = Size(round(0.2 * width), round(0.2 * height));
	Mat shrink;
    //使用双线性插值
	resize(img, shrink, dsize, 0, 0, INTER_LINEAR);

	// 在缩小图像的基础上，放大图像，比例为(1.5, 1.5)
	float fx = 1.5;
	float fy = 1.5;
	Mat enlarge1, enlarge2;
	resize(shrink, enlarge1, Size(), fx, fy, INTER_NEAREST);
	resize(shrink, enlarge2, Size(), fx, fy, INTER_LINEAR);

	// 显示
	imshow("src", img);
	imshow("shrink", shrink);
	imshow("INTER_NEAREST", enlarge1);
	imshow("INTER_LINEAR", enlarge2);
	waitKey(0);
    return 0;
}