本科视觉算法实习生面经

最新推荐文章于 2022-06-23 22:37:45 发布

看星星的许愿者

最新推荐文章于 2022-06-23 22:37:45 发布

阅读量2.1k

点赞数 7

分类专栏：保研&实习文章标签：实习面试计算机视觉

本文链接：https://blog.csdn.net/wobeatit/article/details/82934922

版权

保研&实习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

18年的暑假，因为自己于七月的尾巴决定了自己的保研院校，所以八月份就回到了学校认真梳理知识，计划找一个计算机视觉算法实习的工作来填补大四上学期的空闲。忙碌奔波了一个月，面了几家公司，最终定到了去旷视做旷视研究院的实习生。因为网上针对本科生的实习面经很少，故于十一长假期间想把自己的这段经历写下来，也希望学有余力且能力优秀的本科生看到这篇博客能积极地进公司实习以了解真实社会的需求。

简单介绍一下，因为我是北京大学生，所以找的实习公司都是在北京的，具体实习面试了五家公司：树根互联AILab、图灵通诺、Momenta、爱奇艺、旷视。下面我针对这几家公司具体介绍一下自己的面试历程：

树根互联AILab：面试通过，面试结束的四天后拿到实习录用通知。

树根互联我只面了一轮电话面，整个面试过程大约有40-50分钟，主要还是围绕CV这块询问。电话中首先自我介绍，接着开始针对我的简历询问项目经历，问我的数据集是如何搜集的，我回答是写爬虫+人工手拍照片搜集。然后面试官看我的简历中提到自己学习过CS231n课程，于是面试官询问了dropout的伪代码流程，以及dropout在测试阶段和train阶段的区别与联系还有Batch Normalization的流程和作用，之后又问到了YOLO 系列的区别与联系，以及pytorch的squeeze()函数的功能，不过关于squeeze()函数这块我回答得不是很理想。还问了ResNet和DenseNet这两个basemodel的区别与联系，以及DenseNet的block结构细节。最后问了一个关于OpenCV的使用，问图片中有雪花噪声如何清除，我答是用高斯滤波，面试官给的建议是使用中值滤波。

总的来说，树根互联公司的面试注重的是知识面的考查，问的东西很多但是对于细节并没有要求特别深入。

图灵通诺：只面了一面电话面，之后一两周后并没有等到第二轮面试，不了了之。

图灵通诺的第一面比较水，没有问到任何CV相关的知识，只问了我之前写的爬虫的程序的流程，是如何爬取百度、谷歌的图片，我回答说我在博客中有写过。整个面试过程时间很短，临结束前和面试官闲聊的时候得知面试官仍是清华在校生，他们的团队是初创团队，应该是刚成立，还没有一套完整的招人机制。考虑到如果之后加入他们团队的话需要独立做许多事情，而我自己暂时只想去一个有一定规模的公司在mentor的指导下开展工作，提升自己的技术栈，所以面试结束前表明了自己的心声。

Momenta：面了四轮面试后，HR打电话问是否接受第五轮面试，当时已经签了别的公司offer，就拒绝了。

一面：问了项目细节，项目中使用的分类模型MobileNet的细节，做的是几分类。之后又问了Faster RCNN的RPN部分完整的工作流程，我对于RPN理解得不好，而面试官问得很细，所以在此处就开始崩盘了。最后问了我一道Leetcode上的代码题：buy and sell stocks II，我当时leetcode刷的太少，思路也没打开，所以没有写出来。

二面：只问了两道算法题，第一道是buy and sell stocks I，第二道此处记忆有些模糊，但两道题难度都不是很大，我很快地解决了。

三面：问了在哪保研、可以保证的实习时长，还有Precision、Recall值的计算，问了我之前做的一个OCR识别项目的细节，又问是如何评判该项目最终识别的精度。接下来问了两道算法题，第一道是找出数组中出现频次超过数组长度一半的那个数(剑指Offer中的一道题)，第二道是求n级阶梯跳青蛙问题（剑指Offer中的跳台阶问题的扩展题），两道题难度都适中，我都做了出来，但是第一道没有给出最优解。算法题问完后，又问了一道简单的log函数的图像绘制问题，大概是高中数学的难度，比较水。随后问了Yolo v3和Yolo v2的区别，同时问到了为什么Yolo v3的Softmax会变为二分类Logistic，这个地方我没有想过，所以没有答好。后来又要求我介绍下NMS算法以及问Softmax函数是如何推导的，Softmax的物理含义。

四面：四面是电话面，一共就是三道问题，第一道问的是典型的面试题--三门问题；第二道道问的是求最大值的期望的问题，是大学概率论中的题型；最后一道是算法题，要求从非递减的float型序列中找到目标数值的下标范围（貌似也是剑指Offer中的问题）。

总的来说，Momenta的视觉岗位实习生的标准要求还是蛮高的，他们更注重的是深度而不是广度，同时Momenta公司很喜欢考查算法题，题目大多为剑指Offer和Leetcode上easy到medium难度的题目。

爱奇艺：只面了一轮现场面，面试未通过。

爱奇艺的面试开局就很不顺利，自己因为滴滴上打了拼车迟到半小时，给面试官的第一印象就很差。面试中首先进行项目介绍，接着面试官问了OCR识别这一块的工作以及对于OCR中使用到的算法的理解，我提到了CTPN以及CRNN算法，但这两个算法我都只是了解了梗概的部分，具体细节理解得并不好，回答得也不怎么样。接下来就是一些常用检测模型的询问，竟然被问到了Overfeat模型，我只知道这是14年左右的一篇论文中提到的算法，但是细节还是说不清…面试官转而又询问Yolo系列，这一块我勉强过关。最后问到了和Faster RCNN的区别，比如为什么Faster RCNN精读高一些，为什么Yolo速度快一些这类的问题。

整体而言，爱奇艺的面试官在CV领域的理解比较深入，同时对于实习生的水平要求也很高，他对于简历上CV相关的工作都要求讲出所有的细节。

旷视：现场面试了两轮，当晚收到了录取通知。

一面：一共就问了两道算法题，旷视有白板可以直接在上面手写代码。第一道是视觉中典型的IoU值的计算问题，第二道是给定一个二维数组的bounding box，再给一个target bounding box，要求找到大于0.9的IOU值对应的bounding box，感觉这道题可能是实际场景中遇到的一道题目，我一开始就明确了是二分查找的思路，但是细节处理得很有问题。

二面：二面面试官是做项目经理这种类型的，没有问到任何技术细节，主要是问了我做过的项目的流程、梗概这些，其中也穿插着对于旷视公司的吹捧，员工能力的分布，总之二面给我的心理挫败很大…

回顾我的旷视面试，可能是因为刚好我面的组缺人，所以整个面试过程问到的理论细节并不是很多，也算是赶巧了orz。

我的面试经历大致就是这些，因为自己只是刚入CV坑的本科渣渣，所以也没有多余的建议给大家，还是希望大家多多学习，多刷算法题吧！