计算机视觉基础_cppnuts-CSDN博客

计算机视觉的学习内容

在所有事情开始之前，要把相关的环境设置好。首先你要有OpenCV（对于视觉工程师方向），至少一个深度学习框架（TensorFlow, Kaffe, Keras等，新手推荐用Keras），Ubuntu。还要掌握C++, Python, 和基本的机器学习知识。

C++对于你找AI视觉方向的工作是比较重要的。以下几个工作Title是要求你必须会C++的：

AI Engineer / Computer Vision Engineer / Self-driving Car Engineer /Image Processing Engineer / SLAM Engineer
GPGPU Engineer
而这四类工作Title并不要求你一定会C++：
Data Scientist（Python, R etc.)
Deep Learning Scientist
NLP engineer (Python)
Machine Learning Engineer (Pyhton, Java)

C++11中最重要的是Smart pointer，很容易考到。其次还有STL(vector, map etc.) 添加，删除，排序。类也会考察，类里有很多前缀后缀，如const, static, override, virtual，pure virtual等，这些需要清楚地记得。

然后说到刷题，LeetCode上Easy和Medium的题，起码要刷三百道。最好是能一边上现成的算法课，一边用C++刷题练习。

关于用到的资料，向大家推荐一本C++的书：Effective C++。这本书比较薄，三天内就能看完，可以不用看得太细，它对编程风格的讲解是比较值得一看的。比如你可以了解到面对过程的编程风格和面向对象的编程风格。

最后给大家推荐一个YouTube播主： Cppnuts。他把C++的每个知识点总结成三到五分钟的视频，讲得很不错，大家可以关注。

特征点：Harris角点检测，SIFT，SURF，ORB。例如，面试官可能会问你：在SLAM系统中，我们为什么要用ORB，而不用SIFT和SURF？答案是因为ORB比SIFT和SURF快，并且精度也不错。
描述子和匹配，FLANN算法
相机模型：相机内参，外参数，相机标定。这部分其实是3D的概念，是视觉中的一大块，但不需要了解得太深，现在这个领域绝大部分还是基于深度学习，只需这些基本的概念了解清楚。
基本的大块概念：图像配准，运动检测，光流算法等。
OpenCV：很重要，任何一个关于图像的工程师职位都对OpenCV有要求。Mat基本操作遍历必须会，其他的东西可以根据算法推演。
CUDA：这是找工作过程中非常容易赢得优势的一门技术。任何一个项目如果你说你用了CUDA，并解释得清除完整，会让面试官刮目相看。虽然CUDA有优势但学起来并不容易，内容比较多。

至少熟悉一种框架：如Caffe，Tensorflow，Pytorch，MXNet等。推荐TensorFlow和Keras。Keras适合新手，比较简单，并且和TensorFlow是一样的。对于TensorFlow，推荐《TensoFlow实战》这本书。
至少一次Kaggle项目的经历：Kaggle项目的名次最好在15%以内，这样只需写一个。如果没有名次，就可以多写几个项目。写在简历上的项目要突出两点：第一，你把模型重新训练了一遍。第二，你Ensemble了Multiple models。 Dogs and Cats的获奖感言中讲了一些他做Kaggle的经历，推荐大家去看，可以借鉴他的话用在面试中。历届冠军说的一些感言有很多是十分有用的。
对于这些模型，能够迅速说出其优点：GoogleNet V12345, VGG, ResNet, MobileNet, AlexNet。
模型选择方面：了解Fine tune，参数训练的技巧（如何设定初值，如何调参等）
各种面试的小问题：如你平时喜欢用什么Optimizer？为什么神经网络越深越好？为什么网络要Thin呢？Gradient Vanish造成的原因？为什么会造成Overfitting？怎样克服Overfitting？你怎么看Overfitting？Batch Normalization是什么？还有Range of each hyper parameter，SVM和分类算法的对比，数据集大小和切割