计算机视觉python入门_计算机视觉应该怎样入门?

自学了一段时间计算机视觉(Computer Vision),下文简称:CV。内容以基本概念为主,形式以看书为主,跟着敲代码为辅。起因:因工作中会涉及到交通物流风险管理、出险理赔材料审查等内容,会涉及到大量人工介入审阅照片、视频的环节。而随着素材量的增加将来需要大量的人力来处理,导致成本高,效率低、易出错。

思考:能否通过某种技术进行照片、视频内容的审查,从而消化一定的工作量,同时提升效率?带着这样的问题,我们锁定了CV技术。

这里非常简单地谈谈自己近一年的学习体会,算是入门者说吧。

1、首先明确CV都会在哪些领域里使用,即用途是什么?以下是笔者在今年1月中旬于硅谷参加AI世界前沿大会时拍摄的OpenCV作者Bradski大神的演讲ppt照片(能看得清内容)。

从上图可以看出,CV或者说OpenCV用途十分广泛。那么问题来了,你确认你要学的东西在未来的学习或者工作中可以派上用处吗?如果答案是Yes。就继续往下看。

2、CV是啥?如果用一句话来解释CV,那么可能是研究让机器像人一样具有能够“看”的能力,并在必要的时候给予合适的反馈(输出:比如看图说话,看视频说话)。

3、学什么?从哪里开始学?

从斯坦福大学李飞飞教授的CS231n课程中可以看到,需要有一些基础,以便更好的学习CV。截屏如下:

上图可以看到,需要我们具备一些知识:1)编程基础:Python和C++。个人理解,用Python快速实现算法;用C++实战,实时性能强。

2)数学基础:高数,线性代数、基础概率与统计

3)机器学习基础

3-1)如果你对以上内容都有一定的基础,那么恭喜你,对于入门CV,你有了好的开始。

3-2)推荐几本比较好的书籍:

1、《计算机视觉:模型、学习和推理》入门基础书籍,讲得很清楚。我在看,非常好的与机器学习结合的CV入门书籍。英文好的同学,建议看Prince的原本彩图书籍。官网《英文原版彩图PDF版本》下载链接

2、《Learning OpenCV》实战经典。推荐理由:OpenCV作者Bradski大神的书。学习CV的人是无法绕开OpenCV的。

3、《Python计算机视觉编程》如果你有一定的Python基础,笔者强烈推荐看这本书,把CV的基本概念和算法结合代码实战,讲得比较清楚。入门佳作。它不是一上来就用OpenCV库,使得入门者容易忽视很多基础的概念算法。

4、《计算机视觉:算法与应用》不建议入门者看。宝典型,大而全。典型的工具书。作者是Richard Szeliski,CV界大牛,图像拼接奠基人。

5、《 Multiple View Geometryin Computer Vision 》,中文版名《CV中的多视图几何》据说是玩3D必看的一本书,包括AR/VR。很多CV专家都推荐。

3-3)视频学习,当然是斯坦福大学李飞飞教授的CS231N课程(需要扶梯),这是一门结合深度学习的CV教学视频。经典!

3-4)目前结合深度学习的CV是发展方向之一,有空可以看看花书。

4、OpenCV、TensorFlow、Caffe这些个,咱们现在一个都绕不开。

多上手,多练吧。

5、国际顶尖的CV会议,扫扫论文的摘要、看看报告视频。(如果确定深度研究,就仔细看。否则,个人觉得了解下就好。)

于2017年12月3日凌晨 0:45

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值