openCV第一个lena程序新建运行与详细解说

openCV第一个lena程序新建运行与详细解说

作者:吴甜甜 文字配套视频见B站:https://www.bilibili.com/video/av67293028

完整复制文字请到我的github仓库下载markdown文档 https://github.com/wutiantian/wutiantian.github.io/tree/master/_posts
博客主页 https://wutiantian.github.io/

欢迎转载,请注明本处地址与我(吴甜甜)的名字!

请结合视频再看此文档细节会更清晰


读懂代码

头文件

include\opencv2\opencv.hpp

opencv库的头文件地址:opencv\build\include\opencv2

该地址下有个特别的文件“opencv.hpp”,包含了openCV各模块的头文件,转到定义

各种库头文件简介

【calib3d】——其实就是就是Calibration(校准)加3D这两个词的组合缩写。这个模块主要是相机校准和三维重建相关的内容。基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等等。

【contrib】——也就是Contributed/Experimental Stuf的缩写, 该模块包含了一些最近添加的不太稳定的可选功能,不用去多管。2.4.8里的这个模块有新型人脸识别,立体匹配,人工视网膜模型等技术。

【core】——核心功能模块,包含如下内容:
OpenCV基本数据结构(CvPoint,CvSize,CvScalar等);动态数据结构(CvMemStorage,CvMemBlock等);绘图函数(cvLine,cvRectangle等);数组操作相关函数(cvCreateImage,cvCreateMat等);辅助功能(数据保存和运行时类型信息:CvFileStorage,cvOpenFileStorage等;错误处理和系统函数:cvGetErrStatus,cvAlloc,cvFree等
)与系统函数和宏;与OpenGL的互操作

【imgproc】——Image和Processing这两个单词的缩写组合。图像处理模块,这个模块包含了如下内容:
线性和非线性的图像滤波;图像的几何变换;其它(Miscellaneous)图像转换;直方图相关;结构分析和形状描述;运动分析和对象跟踪;特征检测;目标检测等内容。

【features2d】 ——也就是Features2D, 2D功能框架 ,包含如下内容:
特征检测和描述;特征检测器(Feature Detectors)通用接口;描述符提取器(Descriptor Extractors)通用接口;描述符匹配器(Descriptor Matchers)通用接口;通用描述符(Generic Descriptor)匹配器通用接口;
关键点绘制函数和匹配功能绘制函数

【flann】—— Fast Library for Approximate Nearest Neighbors,高维的近似近邻快速搜索算法库,包含两个部分:快速近似最近邻搜索;聚类

【gpu】——运用GPU加速的计算机视觉模块

【highgui】——也就是high gui,高层GUI图形用户界面,包含媒体的I / O输入输出,视频捕捉、图像和视频的编码解码、图形交互界面的接口等内容。

【legacy】——一些已经废弃的代码库,保留下来作为向下兼容,包含如下相关的内容:
运动分析;期望最大化;直方图;平面细分(C API);特征检测和描述(Feature Detection and escription);描述符提取器(Descriptor Extractors)的通用接口;通用描述符(Generic Descriptor Matchers)的常用接口;匹配器

【ml】——Machine Learning,机器学习模块, 基本上是统计模型和分类算法,包含如下内容:
统计模型 (Statistical Models);一般贝叶斯分类器 (Normal Bayes Classifier);K-近邻 K-NearestNeighbors);支持向量机 (Support Vector Machines);决策树 (Decision Trees);提升(Boosting);梯度提高树(Gradient Boosted Trees);随机树 (Random Trees);超随机树 (Extremely randomized trees);期望最大化 (Expectation Maximization);神经网络 (Neural Networks)
MLData

【nonfree】,也就是一些具有专利的算法模块 ,包含特征检测和GPU相关的内容。最好不要商用,可能会被告哦。

【objdetect】——目标检测模块,包含Cascade Classification(级联分类)和Latent SVM这两个部分。

【ocl】——即OpenCL-accelerated Computer Vision,运用OpenCL加速的计算机视觉组件模块

【photo】——也就是Computational Photography,包含图像修复和图像去噪两部分

【stitching】——images stitching,图像拼接模块,包含如下部分:
拼接流水线;特点寻找和匹配图像;估计旋转;自动校准;图片歪斜;接缝估测;曝光补偿;图片混合

【superres】——SuperResolution,超分辨率技术的相关功能模块

【ts】——opencv测试相关代码,不用去管他

【video】——视频分析组件,该模块包括运动估计,背景分离,对象跟踪等视频处理相关内容。

【Videostab】——Video stabilization,视频稳定相关的组件,官方文档中没有多作介绍,不管它了。

include

iostream 是标准输入输出流,如果你的程序中没有输入也没有输出的话,就没有必要加上 #include ,但是对于初学者,输入和输出可以让你明显感觉到在与程序交互。对于高手,也需要标准出错处理,所以输入输出是相当重要的,但不是必须的。

stdafx.h 到底有什么用

在新建一个项目的时候,很多时候有stdafx.h,我就在想这个文件究竟是干什么的?

stdafx.h : 标准系统包含文件的包含文件,或是经常使用但不常更改的;特定于项目的包含文件。

1.预编译头

头文件夹下会默认有头文件stdafx.h,而源文件夹下则默认有源文件stdafx.cpp,手动将这些文件删除后,编译时系统还会报错

stdafx.h并不是标准C++头文件,也就是说,该文件本质上相当于自定义的一个头文件( 这里是VS默认自定义的文件),与项目的源代码文件存放在同一个文件文件夹下,通过#include"stdafx.h"引用;

从内容上来说,头文件stdafx.h是

1.包含标准头文件 ,就是这个头文件包含标准C的头文件,例如:stdio.h、string.h这些,这种做法实际在我们项目中很常见,把大部分.c文件需要的头文件,放在一个头文件中,这样只有include这一个头文件就行,省事

2.包含项目中的不会轻易改动的头文件

2.预编译头设置

在项目->属性->c/c+±>预编译头,进行设置,

1.开启、关闭预编译头

2.改变预编译头的名字,所以并一定用stdafx名字

3.修改预编译头输出文件的路径

3.预编译头的原理

每一次的预编译宏展开和不同的源文件需要包含一些相同头文件,只要某个源文件发生变化,都要重新做一次宏展开,浪费了很多时间,所以引入了预编译头,预编译头一次编译,重复使用,除非有修改

在编译过程中,stdafx.cpp和stdafx.h文件用于生成一个预编译头文件 project.pch和预编译类型文件stdafx.obj。

但是预编译头文件包含有众多头文件的处理信息,故而其本身会占用较大的存储空间,故而可以注意清理不需要的预编译头。

4.关于报错

  1. 无法打开预编译头文件"xxx.pch":no such file or directory 的问题

分析:根据上面的原理解释,可能是由于编译器无法通过stdafx.cpp创建一个预编译文件,从而其他文件没有办法去引用该pch文件。

解决方案:选中源文件stdafx.cpp,右键 -> 属性 -> C/C++ -> 预编译头,出现上述问题一般是由于预编译头的选项从 创建 变为了 使用 ,通过将选项重新改为创建可解决问题。

  1. 在查找预编译头文件时遇到意外的文件结尾

需要将指令#include"stdafx.h" 放在每个文件的开始位置,以供处理。

命名空间

OpenCV 中的 C++ 类和函数都是定义在命名空间 CV 之内的,有两种方法可以访问。

方法内容
推荐代码开头的适当位置加上 using namespace cv;
麻烦使用 OpenCV类和函数时,都加入 cv:: 命名空间,这4个字符

using namespace cv;

详细包含头文件见“各种库头文件简介”章节

命名规范

命名基本原则:变量名=属性+类型+对象描述,其中每一对象的名称都要求有明确含义,可以取对象名字全称或名字的一部分。

变量命名规则

前缀写法类型描述实例
chchar8位字符chGrade
chTCHAR如果_UNICODE 定义,则为16位字符chName
bBOOL布尔值bEnable
nint整形(大小依赖于操作系统)nLength
nUINT无符号值(大小依赖于操作系统)nHeight
wWORD16位无符号值wPos
lLONG32位有符号整形IOffset
dwDWORD32位无符号整形dwRange
P*指针pDoc
lpFAR*远指针lpszName
lpszLPSTR32位字符串指针lpszName
lpszLPCTSTR如果_UNICODE定义,则为32位常量字符串指针lpszName
hhandleWindows对象句柄hWnd
lpfncallback指向CALLBACK函数的远指针LpfnName

关键字字母组合

描述内容使用的关键字母组合
最大值Max
最小值Min
初始化Init
临时变量T(或Temp)
源对象Src
目的对象Dst

函数与参数

函数命名规则

cvActionTargeMod()

Action 核心函数
Targe 目标图像区域(轮廓、多边形)
Mod 可选变种(变量类型)

main 函数

C/C++的main 函数标准写法:

int main(int argc,char** argv)

所以OpenCV 开源视觉库代码中,常有argc和argv的出现。

arg 指的是“参数”,例如:arguments,argument counter和argument vector.

argc 和 argv 这两个参数一般在命令行编译程序时有用

main函数中的参数
参数argcargv
表示argc为整数*argv[] 字符串数组
含义统计运行程序时送给main函数
命令行参数的个数
存放指向字符串参数的指针数组
每一个元素指向一个参数
默认值为1各成员含义:
argv[0]指向程序运行的全路径名
argv[0]指向在DOS命令行中执行程序名后的第一个字符串
argv[2]指向执行程序名后的第二个字符串
argv[argc]为NULL
  • 各个版本的 Visual studio 编译器中,函数体中是否使用 argc 和argv,返回值为 void 或不为 void ,都是合法的

在 Visual studio 中如果使用 argc 和argv,且没有在 【项目属性】-【配置属性】-【调试】-【命令参数】中指定参数的值,就会报错。这是研究OpenCV官方提供的示例程序时经常碰到的错误。例如:

Mat srcImage=imread(argv[1],1); //读取字符串名为 argv[1]的图片

替换为

Mat srcImage=imread("1.jpg",1); //工程目录下有一张名为“1.jpg”的图片

格式输出 printf() 函数

printf 函数并非 OpenCV 中的函数,而是标准 C 语言函数,包含在 studio.h 之中。

只不过 OpenCV 对其也有包含,只需要包含头文件如 opencv.hpp 就可以使用它

格式字符串作用
%d将整数转成十进制
%f将整数转成浮点数
%u十进制无符号整数
%o将整数转成八进制
%c将整数转成对应的 ASCII 字符
%s将整数转成字符串
%x整数转成小写十六进制
%X整数转成大写十六进制
%p输出地址符
%%输出百分比符号,不进行转换
规定字符作用
\n换行操作
\f清屏并换页
\r回车
\tTab 符

官方资料

官方地址

官方主页openCV Github主页官方论坛中文openCV论坛,于仕琪
http://opencv.orghttps://github.com/opencvhttps://answers.opencv.org/questions/http://www.opencv.org.cn

我的学习书籍

2014年-2016年学习的纸质书
《学习OpenCV》于仕琪 译《OpenCV3编程入门》毛星云《数字图像处理》冈萨雷斯

随着时间推移,更多版本迭代,电子与纸质资源增加,请观看者以自身实时状况选择合适资料。

学习资料的使用

书籍的使用

  • 《OpenCV3编程入门》毛星云,这本书的前半部分是能够帮助新手快速把程序跑起来,到中后期的话,基本没什么用,内容不多。【短期浏览】

  • 《学习OpenCV》于仕琪 译,这本书像砖头的大小,刚开始不要硬啃。拿到手看看目录,随意翻翻。到中后期,遇到原理性问题(非实际程序运行的非具体问题),需要查看原理,需要研读。【中期阅读】

  • 《数字图像处理》冈萨雷斯,这本书前期老师上课讲一讲,学生随便听一听。后期关于业务的本质,解决问题思路的锤炼,需要仔细明白现象本质时需要研读。 【长期阅读】

书是让我们缩短做笔记的时间,可以将自己的笔记直接记录在对应章节备查!

电子书的使用

Learning OpenCV_3rd.pdf 电子书关键字查询

官方API手册https://docs.opencv.org/

网站 https://docs.opencv.org/

下载压缩包,解压后,找到 “index.html”文件即可打开总目录进行查询

营利性性教学视频

营利性的视频往往课时较多,且不会直击要点。

当资源较全较优质可选择、内容较多的情况下,获得知识的速度是:PPT>视频>书。

觉得有用、有时间就看视频,没有时间就看PPT及代码。

把书上的东西转变为自己能够理解的内容,需要时间与精力。视频讲解就是引导我们来理解书上的内容,简化了时间与精力。这也是为什么视频需要花钱购买。如果自己能够直接看书理解,大部分人应该是不会去花这部分钱购买课程的。

如果看视频有不明白的地方,那么有以下几种情况:(1)讲课者能力水平有限,不能在有限时间内把书上内容说明白,甚至把内容像翻译外文书一样翻译错误。这时候可以通过学生提问来解决或者自己找原书来看网上搜索等。(2)知识交叉部分淡薄,例如需要3根鸡腿能饱,但是手头只有1根鸡腿,那么就需要去寻找3根以上鸡腿才行。解决方法基本上是继续(被收割韭菜)买视频或者自己下苦功去把交界处的内容索性再多学一点,不要抱着侥幸心理。

官方学习课程https://courses.learnopencv.com

开源教学项目

https://www.pyimagesearch.com/ 国外的opencv教学网站,有简易答题卡识别

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值