视觉学习笔记之Opencv导入深度学习模型

前言

我的研究方向不是计算机视觉,这段时间开始的CV学习纯粹是出于兴趣,在此记录下自己的学习历程,也方便感兴趣的同伴一起学习。
我计划的学习入门步骤是这样的:
第一步
学会图像数据的预处理,常见的两个工具是Matlab和Opencv,这里我计划先学习Opencv。因为我比较习惯c++和c#的代码,所以更偏向于从c++版本的opencv开始学起。主要是C++预研编写,包含了500多个用于图像/视频处理和计算机视觉的通用算法,而且现在的opencv已经支持了深度学习的导入,可以把预训练的模型导入进来。这一步的学习只要电脑能够跑动VS2019等ide即可,opencv的c++库很多例程相对容易跑动。
第二步
Opencv的学习之后,掌握图像处理的基本学习,并了解了图像处理的基础知识,并且会使用OpenCV来实现某个简单的功能。但是之后,应该学习相关的论文,了解相关的算法,除了深度学习外,还有SLAM等相关的视觉算法,这些都是应学习的。
第三步
深入学习,按照自己的科研项目需求,选择合适的算法继续研究,并构建相关的环境。这一块,可能就考虑自己设备性能了,如计算机有一块性能够好的GPU,软件平台上,最好给电脑装上Ubuntu,然后安装 anaconda和pytorch,虽然这些也有windows版本,但是网上早期学习的资源多数围绕Linux系统,学习资源上更丰富,Ubuntu相对是最容易上手的Linux发行版。

目前,我还处于第一步,学习主要参照的是《OpenCV 4计算机视觉项目实战(原书第2版)》,所学习的代码也是来自于这本书。
这次主要学习的是opencv导入深度学习模型。

配置Opencv

opencv是一个开源的视觉代码框架,首先使用从官网下载的安装包来获取opencv的源代码。
官网上提供了多个版本的opencv,下载后运行其实就是个自解压文件:
在这里插入图片描述

建议解压后的文件夹按照opencv的版本号命名,以便同时配置和管理多个版本opencv,如下图opencv3.2.0和4.5.4版本同时放到了opencv文件夹,这样方便按需选取合适的opencv版本。
自解压后,以使用vc15为例,将*\build\x64\vc15\bin添加到环境变量里面,这样就配置完成了,里面都是一些相关的库文件,各个opencv的工程以后会需要使用到它们:
在这里插入图片描述

导入深度学习模型

opencv已经支持导入深度学习模型,这对于我们这样设备性能有限的人来讲帮助极大。书中第十二章导入的是yoloV3算法,随书的代码中没有包含这一算法的模型,需要自行下载。
下载地址是来自于《windows下的yolov3的运行及结果,实例所需的weights,cfg与names文件》。
主要获取的是算法相关的三个文件
yolov3.cfg、yolov3.weights、coco.names。
其中yolov3. weights个头最大,代表了训练后框架下的权重,是训练后最需要的数据;yolov3.cfg为配置文件;coco.names为标签,用以标记图片识别对象。
利用预先训练好的数据集yolov3.weight, yolo.cfg及标签coco.names,可以快速识别人物,动物,汽车等物体。

测试demo

Opencv的程序,以c++语言编写,这里使用的是书中的第12章demo,运行于VS2019。
首先是在VC++目录选项版上,配置头文件、库文件的路径(我的opencv装在d盘)
在这里插入图片描述
在链接器面板上,注意附加依赖项是lib文件
在这里插入图片描述

检验算法时,先导入网络,即将相关的数据文件yolov3.cfg、yolov3.weights、coco.names导入进去:
在这里插入图片描述

然后是将利用opencv导入图像,并对图像数据处理
在这里插入图片描述
接着是利用训练好的网络对图像数据分析:
在这里插入图片描述
这里主要体现的是神经网络的正向传播,即输入层到输出层,因为已经使用深度学习训练过了模型,所以无需反向传播。
最后将识别的结果显示:
在这里插入图片描述

辨识结果:
在这里插入图片描述
也算是跑通了第一个例子。

总结

这第一个跑通的程序中,首先明白的一点是opencv是一个框架,它负责导入图像,并对图像数据进行预处理,而后一个已经训练过的深度学习模型,可以对处理后的数据进行进一步分析,实现图像中的对象识别、定位等功能。

  • 4
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
课程目的:OpenCV是应用非常广泛的开源视觉处理库,在图像处理、计算机视觉和自动驾驶中有着非常重要的作用。课程设计特色:(课程当前为第一期)1、C++与Python双语教学Python语言是在计算机视觉中应用最多的一种语言,在工作中,深度学习模型的训练基本上都是使用Python语言编写的训练代码。OpenCV在这个过程中用于图像的预处理(例如图像读取、数据增强)和后处理,还可以用于显示处理的结果,功能强大,使用方便。但是在功能的部署的时候,不管是部署在服务端还是PC端,开发语言基本上用的是C++,所以如何有效的使用OpenCV进行模型或者功能的部署尤为重要。C++语言应用的好坏,在面试中可以看出一个面试者的工程实践能力的强弱,两种语言的开发掌握好了可以使工作如虎添翼。2、全模块讲解我出版了一本图书《学习OpenCV4:基于Python的算法实战》,虽然这本书是写的基于Python的算法实战,但是实际上这本书有详细的介绍算法的C++接口,还有一些C++方向的案例,是以Python为主。图书出版的时候就想双语写作,只是限于篇幅没有成行。本课程不仅采用双语教学,更是对C++的每个模块都做讲解,我们知道,很多的书其实只讲imgproc,如果你翻开一本书图像的形态学运算和图像滤波都是作为独立章节讲解的,那么这本书基本上就可以确定是只是讲解了imgproc模块,但是其他的模块在工作中也有很重要的作用。例如:core模块定义了C++的基本数据结构和基本运算(如四则运算);highgui模块是可视化与交互的模块;feature2d是特征点与特征匹配相关算法所在的模块;ml是机器学习相关的模块;dnn是深度学习相关的模块,可以使用OpenCV进行深度学习模型的部署。这些是很多的书和课程都不会讲的。3、讲解细致本课程会从环境搭建开始讲解,环境搭建尤为重要。从我多年的授课经验总结来看,如果只是给了代码,很多的入门用户环境问题处理不好的话,后面的学习很难进行下去,甚至会丧失学习的信心。4、会讲解C++和Python的开发语法问题是入门用户的一大难关,特别是C++语言。大学只是教授了C语言相关的内容,C++很多同学只懂一点皮毛,所以写代码步履维艰,我们在讲解代码的过程中会顺带讲解C++和Python的内容。我们还会讲解编译相关知识,还有库的装载与链接,这些是学校里不会教的,目前也几乎没有课程讲解。5、讲师经验丰富我讲解过C++和OpenCV的多个课程,广受学员好评。我出版过两本图书《深度学习计算机视觉实战》和《学习OpenCV4》,两本书都是细致入微的讲解,主要针对的就是初学者,所以能够很好的处理课程的难易程度。6、讲义准备充分讲义准备的充分细致,标识清楚明确,重点和疑难点突出。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值