小白入门计算机视觉:这是最全的一份CV技术学习之路

AI


最近AI菌决定把自己的机器学习之路向计算机视觉方面发展。所以今天就来给大家分享一下AI菌收集到的资料以及心得


The M Tank 编辑了一份报告《A Year in Computer Vision》,记录了 2016 至 2017 年计算机视觉领域的研究成果,对开发者和研究人员来说是不可多得的一份详细材料。该材料共包括四大部分


简介

第一部分

    分类/定位

    目标检测

    目标追踪

第二部分

    分割

    超分辨率、风格迁移、着色

    动作识别

第三部分

    3D 目标

    人体姿势估计

    3D 重建

    其他未分类 3D

    总结

第四部分

    卷积架构

    数据集

    不可分类的其他材料与有趣趋势

结论


有兴趣的同学可以读一读,完整 PDF 地址:http://www.themtank.org/pdfs/AYearofComputerVisionPDF.pdf


下面是收集到的学习资料与心得的汇总:

(文中没有发的资源将在之后陆续放出)


01 掌握好相应的基础能力


计算机视觉的理念其实与很多概念有部分重叠,包括:人工智能、数字图像处理、机器学习、深度学习、模式识别、概率图模型、科学计算以及一系列的数学计算等。


所以在入门CV之前,同学们最好对基础的学术课程都有对应的了解,比如数学方面的微积分,概率学,统计学,线性代数这几门基础课程。


在编程语言方面,Matlab,Python,C++,最好熟悉其中2种,因为计算机视觉离开计算机编程是完全行不通的




 

02 需要的专业工具


工欲善其事,必先利其器。对于想要学好计算机视觉的同学来说,一个专业的工具,绝对是助攻的不二神器。


OpenCV(开源计算机视觉库)是一个非常强大的学习资料库,包括了计算机视觉,模式识别,图像处理等许多基本算法。


它免费提供给学术和商业用途,有C++,C,Python和java接口,支持Windows、Linux、Mac OS、iOS和Android。


而关于OpenCV的学习,AI菌推荐(其中第三本目前无中文版):


学习OpenCV(Learning.OpenCV)


链接:

https://pan.baidu.com/s/1c2GrPEK 密码:7012



毛星云老师编著的OpenCV3编程入门


链接:

https://pan.baidu.com/s/1c2xuVFq 密码:2s4a


学习OpenCV3(

Learning OpenCV 3


链接:

https://pan.baidu.com/s/1geQeT0J 密码:cuco


而深度学习方面,有TensorFlow,PyTorch,Caffe等深度学习框架,它们也内置了OpenCV的API接口。而哪种框架好,就要看你自己的需要了


推荐资料:

莫凡教程系列之PyTorch :https://morvanzhou.github.io/tutorials/machine-learning/torch/


TensorFlow中文社区:

http://www.tensorfly.cn/



深度学习 21天实战Caffe




 

03 绕不开的数字图像处理与模式识别


数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。


入门的同学推荐

冈萨雷斯的《数字图像处理》《数字图像处理(第3版)(英文版)》和对应的Matlab版本


一本讲基础的理论,一本讲怎么用Matlab实现。


除此之外同学们还可以去YouTube上找到相关的课程信息,相信大家会有所收获的。


模式识别(Pattern Recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。


计算机视觉很多东西都是基于图像识别的,图像识别就是模式识别的一种。


模式识别通常是训练一个模型来拟合当前的数据,当我们拿到一堆数据或图片,需要从当中找到它们的关系,最便捷的便是用模式识别算法来训练一个模型。


AI菌推荐一本模式识别入门级的教材《模式分类》,相对于《模式识别》这本书来说可能比较难,但书中介绍了很多模式识别经典的分类器,还是很值得一读。


其中的一些思想在神经网络中也可以应用的




 


04 系统的学习下计算机视觉课程


对于CV新手来说,想要从小白到大神,最快的方法就是先系统的学习一下计算机视觉的课程,全面了解一下计算机视觉这个领域的背景及其发展、这个领域有哪些基本的问题、哪些问题的研究已经比较成熟了,哪些问题的研究还处于基础阶段。


在这里AI菌推荐3本经典教材:


《计算机视觉:一种现代方法》(Computer Vision: A Modern Approach)


《计算机视觉_算法与应用》

(Computer Vision: Algorithms and Applications)



《计算机视觉:模型 学习和推理》

(Computer Vision: Models, Learning, and Inference)


这三本教材AI菌认为是计算机视觉最好的入门教材了,内容丰富,难度适中,其中第二本书涉及大量的文献,很适合对计算机视觉没什么概念的同学。


虽然其中的一些方法在现在看来已经过时了,但还是值得一读



 

05 深度学习与CNN


关于深度学习这几年讲的已经太多了,资料也非常多,AI菌在这里就不在赘述啦


计算机视觉里经常使卷积神经网络,即CNN,是一种对人脑比较精准的模拟。


什么是卷积?卷积就是两个函数之间的相互关系,然后得出一个新的值,他是在连续空间做积分计算,然后在离散空间内求和的过程。


同学们可以试着学习下CNN在计算机视觉当中的应用


推荐的资料:

斯坦福CS231n—深度学习与计算机视觉网易云课堂课程:http://study.163.com/course/introduction.htm?courseId=1003223001


斯坦福CS231n—深度学习与计算机视觉官方课程:http://cs231n.stanford.edu/


CS231n官方笔记授权翻译总集篇:https://www.52ml.net/17723.html


吴恩达 deeplearning.ai与网易云课堂的微专业深度学习工程师卷积神经网络


http://mooc.study.163.com/course/2001281004?tid=2001392030#/info


神经网络方面的经典教材


《深度学习》

(Deep Learning)


《神经⽹络与深度学习》

(Neural Networks and Deep Learning(Nielsen,2017))





 

06 了解最新领域动态


很多同学做研究的时候,容易陷入自我封闭的“怪圈”,过于执着于埋头学习相关知识,有时候会忘记及时了解相关领域的最新动态,这是非常不科学的。


同学们在学习计算机视觉相关知识的时候,可以通过最新的paper来了解这个领域最新提出的一些概念以及发展的情况。


计算机视觉的期刊有两个PAMI(模式分析与机器智能汇刊)和IJCV(计算机视觉国际期刊)


顶级的学术会议有 CVPR、ICCV、 ECCV、 BMVC这四个,同学们可以跟着浏览这些期刊论文以及会议文章,相信一定可以学到不少有用的知识。




 

AI


听做视觉的师兄师姐硕:做好计算机视觉研究并不是一件容易的事情,在大多数情况下它甚至是一件很枯燥的事情。


研究成果毫无进展,研究方向不在明朗等等,这一切都会给你前所未有的压力


所以希望同学们在决定入这一行的时候,是出于自己的热爱,而不是出于当前的趋势。


因为热爱不会变,但趋势每一年都在变。



不失初心,不忘初衷


AI玩转智能


  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值