OpenCV简介
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库,它提供了很多函数,这些函数非常高效地实现了计算机视觉算法(最基本的滤波到高级的物体检测等等)。是一个开源的计算机视觉应用平台,由英特尔公司研发中心俄罗斯团队发起该项目,开源BSD证书,OpenCV的目标是实现实时计算机视觉,,是一个跨平台的计算机视觉库。从开发之日起就得到了迅猛发展,获得了众多公司和业界大牛的鼎力支持与贡献,因为是BSD开源许可,因此可以免费应用在科研和商业应用领域。
OpenCV 使用 C/C++ 开发,同时也提供了 Python、Java、MATLAB 等其他语言的接口。OpenCV是跨平台的,可以在Windows、Linux、Mac OS、Android、iOS 等操作系统上运行。OpenCV 的应用领域非常广泛,包括图像拼接、图像降噪、产品质检、人机交互、人脸识别、动作识别、动作跟踪、无人驾驶等。OpenCV 还提供了机器学习模块,你可以使用正态贝叶斯、K最近邻、支持向量机、决策树、随机森林、人工神经网络等机器学习算法。
OpenCV的应用场景
许多计算机科学家和经验丰富的程序员多多少少都了解计算机视觉的某些方面,但是很少有人熟谙计算机视觉的每一个应用。比如:
- 很多人了解计算机视觉在安保行业的应用;
- 一些人也知道它在网页端的图像和视频处理中的应用在逐渐增加。
但很少有人知道计算机视觉在游戏交互中的应用。同时,也很少有人认识到大部分航空图像和街景图像(比如说谷歌街景)已经大量应用相机校正和图像拼接技术。
有一些人略微知道一点视觉在自动监控、无人机或者生物制药分析上的应用,但很少有人知道计算机视觉早已经在制造业普遍使用。事实上,批量制造的所有东西都已经利用计算机视觉在进行某些方面的质检工作了。
OpenCV 亦是斯坦福大学的机器人斯坦利(Stanley)至关重要的一部分,这个机器人赢得了美国国防部高级研究计划署主持的 DARPA 机器人挑战赛野外机器人竞速的 200 万美元大奖。
DARPPA 机器人挑战赛(DRC)是机器人领域的一项重大赛事,堪称“机器人的奥林匹克”。
OpenCV自从1.0版本发布以来,立刻吸引许多公司目光,被广泛应用在许多领域的产品研发与创新上,相关应用包括卫星地图与电子地图拼接、医学中图像噪声处理、对象检测、安防监控领域安全与入侵检测、自动监视报警、制造业与工业中的产品质量检测、摄像机标定。军事领域的无人机飞行、无人驾驶与水下机器人等众多领域。
OpenCV框架介绍
OpenCV中已经包含如下核心功能: - 二维和三维特征工具箱
- 运动估算
- 人脸识别系统
- 姿势识别
- 人机交互
- 移动机器人
- 运动理解
- 对象鉴别
- 分割与识别
- 立体视觉
- 运动跟踪
- 增强现实(AR技术)
- 基于上述功能实现需要,OpenCV中还包括以下基于统计学机器学习库:
- Boosting算法
- Decision Tree(决策树)学习
- Gradient Boosting算法
- EM算法(期望最大化)
- KNN算法
- 朴素贝叶斯分类
- 人工神经网络
- 随机森林
- 支掌向量机
OpenCV实例介绍(人脸识别)
我们重点关注opencv2文件夹里面的文件,可以看到类似下图所示的文件夹。
各主要模块介绍:
【core】–核心功能模块,包含以下内容:
OpenCV基本数据结构
动态数据结构
绘图函数
数组操作相关函数
辅助功能与系统函数和宏
与OpenGL的互操作
【imgproc】–图像处理模块,包含以下内容:
线性和非线性的图像滤波
图像的几何变换
其它(Miscellaneous)图像转换
直方图相关
结构分析和形状描述
运动分析和对象跟踪
特征检测
目标检测等内容
【features2D】–2D功能模块,包含以下内容:
特征检测和描述
特征检测器(Feature Detectors)通用接口
描述符提取器(Descriptor Extractors)通用接口
描述符匹配器(Descriptor Matchers)通用接口
通用描述符(Generic Descriptor)匹配器通用接口
关键点绘制函数和匹配功能绘制函数
【highgui】–高层gui图形用户界面(high GUI),包含:
媒体的I / O输入输出
视频捕捉
图像和视频的编码解码
图形交互界面的接口等内容
关键点绘制函数和匹配功能绘制函数
关键点绘制函数和匹配功能绘制函数
【ml】——Machine Learning,机器学习模块, 基本上是统计模型和分类算法,包含如下内容:
统计模型 (Statistical Models)
一般贝叶斯分类器 (Normal Bayes Classifier)
K-近邻 (K-NearestNeighbors)
支持向量机 (Support Vector Machines)
决策树 (Decision Trees)
提升(Boosting)
梯度提高树(Gradient Boosted Trees)
随机树 (Random Trees)
超随机树 (Extremely randomized trees)
期望最大化 (Expectation Maximization)
神经网络 (Neural Networks)
MLData
【calib3d】——其实就是就是Calibration(校准)加3D这两个词的组合缩写。这个模块主要是相机校准和三维重建相关的内容。基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等等。
【contrib】——也就是Contributed/Experimental Stuf(贡献、实验部分)的缩写, 该模块包含了一些最近添加的不太稳定的可选功能,不用去多管。2.4.8里的这个模块有新型人脸识别,立体匹配,人工视网膜模型等技术。我所安装的opencv3.4版本已将此模块去掉啦
【flann】—— Fast Library for Approximate Nearest Neighbors,高维的近似近邻快速搜索算法库,包含两个部分:
快速近似最近邻搜索
聚类
【legacy】—— 一些已经废弃的代码库,保留下来作为向下兼容,包含如下相关的内容:
运动分析
期望最大化
直方图
平面细分(C API)
特征检测和描述(Feature Detection and Description)
描述符提取器(Descriptor Extractors)的通用接口
通用描述符(Generic Descriptor Matchers)的常用接口
匹配器
【nonfree】,也就是一些具有专利的算法模块 ,包含特征检测和GPU相关的内容。最好不要商用,可能会被告哦。
【objdetect】——目标检测模块,包含Cascade Classification(级联分类)和Latent SVM这两个部分。
【ocl】——即OpenCL-accelerated Computer Vision,运用OpenCL加速的计算机视觉组件模块
【photo】——也就是Computational Photography,包含图像修复和图像去噪两部分
【stitching】——images stitching,图像拼接模块,包含如下部分:
拼接流水线
特点寻找和匹配图像
估计旋转
自动校准
图片歪斜
接缝估测
曝光补偿
图片混合
【superres】——SuperResolution,超分辨率技术的相关功能模块
【ts】——opencv测试相关代码,不用去管他
【video】——视频分析组件,该模块包括运动估计,背景分离,对象跟踪等视频处理相关内容。
【Videostab】——Video stabilization,视频稳定相关的组件,官方文档中没有多作介绍,不管它了。
注意:opcv3新增了shape模块!
【shape】–形状的匹配以及距离计算SHAPE
Shape Distance and Matching,形状的距离以及匹配
//对这部分了解不是很多,只能形而上学地复制过来了
Opencv3特有的部分,Opencv2.4并没有…
- AffineTransformer仿射变换算法的包装类
- HistogramCostExtractor
- HausdorffDistanceExtractor
- ShapeContextDistanceExtractor
- ThinPlateSplineShapeTransformer