计算机视觉基础

计算机视觉的学习内容

在所有事情开始之前,要把相关的环境设置好。首先你要有OpenCV(对于视觉工程师方向),至少一个深度学习框架(TensorFlow, Kaffe, Keras等,新手推荐用Keras),Ubuntu。还要掌握C++, Python, 和基本的机器学习知识。

  1. C++在AI类工作中有怎样的重要性?

C++对于你找AI视觉方向的工作是比较重要的。以下几个工作Title是要求你必须会C++的:

  • AI Engineer / Computer Vision Engineer / Self-driving Car Engineer /Image Processing Engineer / SLAM Engineer

  • GPGPU Engineer
    而这四类工作Title并不要求你一定会C++:

  • Data Scientist(Python, R etc.)

  • Deep Learning Scientist

  • NLP engineer (Python)

  • Machine Learning Engineer (Pyhton, Java)

  1. 如何准备C++?

C++11中最重要的是Smart pointer,很容易考到。其次还有STL(vector, map etc.) 添加,删除,排序。类也会考察,类里有很多前缀后缀,如const, static, override, virtual,pure virtual等,这些需要清楚地记得。

然后说到刷题,LeetCode上Easy和Medium的题,起码要刷三百道。最好是能一边上现成的算法课,一边用C++刷题练习。

关于用到的资料,向大家推荐一本C++的书:Effective C++。这本书比较薄,三天内就能看完,可以不用看得太细,它对编程风格的讲解是比较值得一看的。比如你可以了解到面对过程的编程风格和面向对象的编程风格。

最后给大家推荐一个YouTube播主: Cppnuts。他把C++的每个知识点总结成三到五分钟的视频,讲得很不错,大家可以关注。

  1. 找AI视觉方向的工作,你需要哪些必要的图像知识?
  • 特征点:Harris角点检测,SIFT,SURF,ORB。例如,面试官可能会问你:在SLAM系统中,我们为什么要用ORB,而不用SIFT和SURF?答案是因为ORB比SIFT和SURF快,并且精度也不错。
    描述子和匹配,FLANN算法
  • 相机模型:相机内参,外参数,相机标定。这部分其实是3D的概念,是视觉中的一大块,但不需要了解得太深,现在这个领域绝大部分还是基于深度学习,只需这些基本的概念了解清楚。
  • 基本的大块概念:图像配准,运动检测,光流算法等。
  • OpenCV:很重要,任何一个关于图像的工程师职位都对OpenCV有要求。Mat基本操作遍历必须会,其他的东西可以根据算法推演。
  • CUDA:这是找工作过程中非常容易赢得优势的一门技术。任何一个项目如果你说你用了CUDA,并解释得清除完整,会让面试官刮目相看。虽然CUDA有优势但学起来并不容易,内容比较多。
  1. 你需要哪些深度学习的知识积累?
  • 至少熟悉一种框架:如Caffe,Tensorflow,Pytorch,MXNet等。推荐TensorFlow和Keras。Keras适合新手,比较简单,并且和TensorFlow是一样的。对于TensorFlow,推荐《TensoFlow实战》这本书。
  • 至少一次Kaggle项目的经历:Kaggle项目的名次最好在15%以内,这样只需写一个。如果没有名次,就可以多写几个项目。写在简历上的项目要突出两点:第一,你把模型重新训练了一遍。第二,你Ensemble了Multiple models。 Dogs and Cats的获奖感言中讲了一些他做Kaggle的经历,推荐大家去看,可以借鉴他的话用在面试中。历届冠军说的一些感言有很多是十分有用的。
  • 对于这些模型,能够迅速说出其优点:GoogleNet V12345, VGG, ResNet, MobileNet, AlexNet。
  • 模型选择方面:了解Fine tune,参数训练的技巧(如何设定初值,如何调参等)
  • 各种面试的小问题:如你平时喜欢用什么Optimizer?为什么神经网络越深越好?为什么网络要Thin呢?Gradient Vanish造成的原因?为什么会造成Overfitting?怎样克服Overfitting?你怎么看Overfitting?Batch Normalization是什么?还有Range of each hyper parameter,SVM和分类算法的对比,数据集大小和切割

计算机视觉(ComputerVision, CV)相关领域的网站链接

(1)googleResearch; http://research.google.com/index.html
(2)MIT博士,汤晓欧学生林达华; http://people.csail.mit.edu/dhlin/index.html
(3)MIT博士后Douglas Lanman; http://web.media.mit.edu/~dlanman/
(4)opencv中文网站; http://www.opencv.org.cn/index.php/首页
(5)Stanford大学vision实验室; http://vision.stanford.edu/research.html
(6)Stanford大学博士崔靖宇; http://www.stanford.edu/~jycui/
(7)UCLA教授朱松纯; http://www.stat.ucla.edu/~sczhu/
(8)中国人工智能网; http://www.chinaai.org/
(9)中国视觉网; http://www.china-vision.net/
(10)中科院自动化所; http://www.ia.cas.cn/
(11)中科院自动化所李子青研究员; http://www.cbsr.ia.ac.cn/users/szli/
(12)中科院计算所山世光研究员; http://www.jdl.ac.cn/user/sgshan/
(13)人脸识别主页; http://www.face-rec.org/
(14)加州大学伯克利分校CV小组; http://www.eecs.berkeley.edu/Research/Projects/CS/vision/
(15)南加州大学CV实验室; http://iris.usc.edu/USC-Computer-Vision.html
(16)卡内基梅隆大学CV主页; http://www-2.cs.cmu.edu/afs/cs/project/ … ision.html
(17)微软CV研究员Richard Szeliski; http://research.microsoft.com/en-us/um/people/szeliski/
(18)微软亚洲研究院计算机视觉研究组; http://research.microsoft.com/en-us/groups/vc/
(19)微软剑桥研究院ML与CV研究组; http://research.microsoft.com/en-us/gro … fault.aspx
(20)研学论坛; http://bbs.matwav.com/
(21)美国Rutgers大学助理教授刘青山; http://www.research.rutgers.edu/~qsliu/
(22)计算机视觉最新资讯网; http://www.cvchina.info/
(23)运动检测、阴影、跟踪的测试视频下载; http://apps.hi.baidu.com/share/detail/18903287
(24)香港中文大学助理教授王晓刚; http://www.ee.cuhk.edu.hk/~xgwang/
(25)香港中文大学多媒体实验室(汤晓鸥); http://mmlab.ie.cuhk.edu.hk/
(26)U.C. San Diego. computer vision; http://vision.ucsd.edu/content/home
(27)CVonline; http://homepages.inf.ed.ac.uk/rbf/CVonline/
(28)computer vision software; http://peipa.essex.ac.uk/info/software.html
(29)Computer Vision Resource; http://www.cvpapers.com/
(30)computer vision research groups; http://peipa.essex.ac.uk/info/groups.html
(31)computer vision center; http://computervisioncentral.com/cvcnews

(32)浙江大学图像技术研究与应用(ITRA)团队:http://www.dvzju.com/
(33)自动识别网:http://www.autoid-china.com.cn/
(34)清华大学章毓晋教授:http://www.tsinghua.edu.cn/publish/ee/4157/2010/20101217173552339241557/20101217173552339241557_.html
(35)顶级民用机器人研究小组Porf.Gary领导的Willow Garage: http://www.willowgarage.com/
(36)上海交通大学图像处理与模式识别研究所:http://www.pami.sjtu.edu.cn/

(37)上海交通大学计算机视觉实验室刘允才教授:http://www.visionlab.sjtu.edu.cn/

(38)德克萨斯州大学奥斯汀分校助理教授Kristen Grauman :http://www.cs.utexas.edu/~grauman/

(39)清华大学电子工程系智能图文信息处理实验室(丁晓青教授):http://ocrserv.ee.tsinghua.edu.cn/auto/index.asp

(40)北京大学高文教授:http://www.jdl.ac.cn/htm-gaowen/

(41)清华大学艾海舟教授:http://media.cs.tsinghua.edu.cn/cn/aihz

(42)中科院生物识别与安全技术研究中心:http://www.cbsr.ia.ac.cn/china/index CH.asp

(43)瑞士巴塞尔大学 Thomas Vetter教授:http://informatik.unibas.ch/personen/vetter_t.html

(44)俄勒冈州立大学 Rob Hess博士:http://blogs.oregonstate.edu/hess/

(45)深圳大学 于仕祺副教授:http://yushiqi.cn/

(46)西安交通大学人工智能与机器人研究所:http://www.aiar.xjtu.edu.cn/

(47)卡内基梅隆大学研究员Robert T. Collins: http://www.cs.cmu.edu/~rcollins/home.html#Background

(48)MIT博士Chris Stauffer: http://people.csail.mit.edu/stauffer/Home/index.php

(49)美国密歇根州立大学生物识别研究组(Anil K. Jain教授):http://www.cse.msu.edu/rgroups/biometrics/

(50)美国伊利诺伊州立大学Thomas S. Huang:http://www.beckman.illinois.edu/directory/t-huang1

(51)武汉大学数字摄影测量与计算机视觉研究中心:http://www.whudpcv.cn/index.asp

(52)瑞士巴塞尔大学Sami Romdhani助理研究员:http://informatik.unibas.ch/personen/romdhani_sami/

(53)CMU大学研究员Yang Wang:http://www.cs.cmu.edu/~wangy/home.html

(54)英国曼彻斯特大学Tim Cootes教授:http://personalpages.manchester.ac.uk/staff/timothy.f.cootes/

(55)美国罗彻斯特大学教授Jiebo Luo: http://www.cs.rochester.edu/u/jluo/

(56)美国普渡大学机器人视觉实验室:https://engineering.purdue.edu/RVL/Welcome.html

(57)美国宾利州立大学感知、运动与认识实验室:http://vision.cse.psu.edu/home/home.shtml

(58)美国宾夕法尼亚大学GRASP实验室:https://www.grasp.upenn.edu/

(59)美国内达华大学里诺校区CV实验室:http://www.cse.unr.edu/CVL/index.php

(60)美国密西根大学vision实验室: http://www.eecs.umich.edu/vision/index.html

(61)University of Massachusetts(麻省大学),视觉实验室:http://vis-www.cs.umass.edu/index.html

(62)华盛顿大学博士后Iva Kemelmacher: http://www.cs.washington.edu/homes/kemelmi

(63)以色列魏茨曼科技大学Ronen Basri: http://www.wisdom.weizmann.ac.il/~ronen/index.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值