玩转人工智能(6)应用之计算机视觉必知必会及快速上手

计算机视觉是什么?

https://zh.wikipedia.org/wiki/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89,这是一门让机器学会看的科学。类似于人的眼睛,或者双眼,认识和处理看到的万事万物,人类利用眼睛收集和感知自然世界的信息,计算机视觉技术的目的是让机器也具有类似人眼的能力,人类的世界丰富多彩,计算机看来就是由无以计数的图片构成,或者说是三维模型,但本质就是图像。所以,计算机数据的研究重点是处理信号,分析信号的特征。目前比较主流的研究方式是:图像处理、视频处理、三维重建、场景复原、行为分析等等等等。

当前主流的大作个人推荐《Computer Vision: Algorithms and Applications》,网上有电子版,当然国内在计算机视觉方面的作品也比较多,也比较成熟,读者可根据自己的情况自行选择。如果是深入研究推荐读者重点关注前沿的paper或者顶级会议比如ICCV、ACM、CVPR、ECCV等。介绍到这里加入读者已经对于短文中的关键词都已经GOOGLE了,那么可以认为读者已经深入计算机视觉的前沿阵地了。

再追加个视频教程吧:https://open.163.com/movie/2015/3/Q/R/MAKN9A24M_MAKN9QAQR.html

http://study.163.com/course/introduction/1003223001.htm  斯坦福李飞飞的视频教程


开始作战,先造个武器吧,哈哈,别急,武器别人已经造好了。OpenCV库。原文版本:https://opencv.org/  

中文版本:http://www.opencv.org.cn/  截止博客日期,opencv已经发布3.4版本。一款武器,应该有制造说明书,比如我们安装opencv后再安装包下找到API手册。opencv使用执行效率很高的C++代码编写,不过目前已经兼容python,目前只是提供了python2.7的编译包而已,不过,即使我们使用的python3.X,也没关系,目前只要我们理解代码设计,稍作修改都是可以兼容的。上手最快的方法就是动手,安装包中有样例,全部花时间过一遍,然后想想别人为什么是这样写代码的,最后自己写几个案例。

从哪里查阅opencv的api手册:https://docs.opencv.org/master/d6/d00/tutorial_py_root.html(python版本)

https://github.com/abidrahmank/OpenCV2-Python-Tutorials/tree/master/source

目前学习opencv库最好的教程是按照官方文档模仿学习,不要错过每一句代码的描述。进步最快的办法就是坚持。

按照课程介绍,opencv库主要包括安装使用指导、GUI特性介绍、Core介绍、Image Process章节、图像检测、视频分析、图像矫正和三维重建、机器学习、计算机图像学、物体检测、创建python+opencv工程。

安装使用指导:Windows7+python3.5+opencv3.4,首先安装python3.5,下载路径:https://www.python.org,下载读者喜欢的版本即可。在安装的过程中注意勾选默认添加路径(免得安装后还需要添加path路径),一键到底即可。默认是安装了pip的,一般在python的安装文件下。然后下在opencv,下载后在pip的文件下cmd,然后在弹出的命令窗口直接输入:pip install opencv_python,注意,这个工程一般会提示python下运行opencv需要支撑的基础包,比如numpy和matplot等,按照提示缺少包就pip install xxx即可。网络较好一般五分钟即可适配完成。在python的GUI命令窗口中运行import cv2不出错提示,表示安装完成。

GUI介绍:首先介绍了三个函数的使用。cv2.imread()、cv2.imwrite()、cv2.imshow(),读取图像、保存图像、现实图像。注意,在python的opencv中jpg图像是按照BGR通道呈现的。然后介绍了读取视频、播放和保存视频,如何从摄像头捕捉图像也做了介绍。然后介绍了绘图,介绍了cv2.line、cv2.circle等一些列函数。最后介绍了鼠标事件和进度条和配色版。

CORE介绍:主要介绍了图像的基本操作以及函数实现,图像处理的基本算法以及算法方案的改进和优化。

图像处理介绍:图像处理基础的实现,比如直方图,平化、锐化、各种变换等的实现。

举一反三,触类旁通,opencv对图像视频以及三维模型方面的基本计算进行了很好的封装,在后面的博客中结合生产应用,将展开深入介绍。

计算机视觉的门槛较低,读者看到这里已经跨入计算机视觉技术的大门之内了,所以,欢迎读者朋友open,提问分享,一起加油!

辅助材料:https://www.cnblogs.com/findumars/p/5009003.html,读者有兴趣可阅览。

如果读者继续想深入,建议读者学习图型学相关的知识,上手使用opengl和gpu编程,三维图像图像方面的研究和应用应该是当前的热点,也是前沿。











  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值