本科视觉算法实习生面经

       18年的暑假,因为自己于七月的尾巴决定了自己的保研院校,所以八月份就回到了学校认真梳理知识,计划找一个计算机视觉算法实习的工作来填补大四上学期的空闲。忙碌奔波了一个月,面了几家公司,最终定到了去旷视做旷视研究院的实习生。因为网上针对本科生的实习面经很少,故于十一长假期间想把自己的这段经历写下来,也希望学有余力且能力优秀的本科生看到这篇博客能积极地进公司实习以了解真实社会的需求。

       简单介绍一下,因为我是北京大学生,所以找的实习公司都是在北京的,具体实习面试了五家公司:树根互联AILab、图灵通诺、Momenta、爱奇艺、旷视。下面我针对这几家公司具体介绍一下自己的面试历程:

       树根互联AILab:面试通过,面试结束的四天后拿到实习录用通知。

       树根互联我只面了一轮电话面,整个面试过程大约有40-50分钟,主要还是围绕CV这块询问。电话中首先自我介绍,接着开始针对我的简历询问项目经历,问我的数据集是如何搜集的,我回答是写爬虫+人工手拍照片搜集。然后面试官看我的简历中提到自己学习过CS231n课程,于是面试官询问了dropout的伪代码流程,以及dropout在测试阶段和train阶段的区别与联系还有Batch Normalization的流程和作用,之后又问到了YOLO 系列的区别与联系,以及pytorch的squeeze()函数的功能,不过关于squeeze()函数这块我回答得不是很理想。还问了ResNet和DenseNet这两个basemodel的区别与联系,以及DenseNet的block结构细节。最后问了一个关于OpenCV的使用,问图片中有雪花噪声如何清除,我答是用高斯滤波,面试官给的建议是使用中值滤波。

       总的来说,树根互联公司的面试注重的是知识面的考查,问的东西很多但是对于细节并没有要求特别深入。

       图灵通诺:只面了一面电话面,之后一两周后并没有等到第二轮面试,不了了之。

       图灵通诺的第一面比较水,没有问到任何CV相关的知识,只问了我之前写的爬虫的程序的流程,是如何爬取百度、谷歌的图片,我回答说我在博客中有写过。整个面试过程时间很短,临结束前和面试官闲聊的时候得知面试官仍是清华在校生,他们的团队是初创团队,应该是刚成立,还没有一套完整的招人机制。考虑到如果之后加入他们团队的话需要独立做许多事情,而我自己暂时只想去一个有一定规模的公司在mentor的指导下开展工作,提升自己的技术栈,所以面试结束前表明了自己的心声。

        Momenta:面了四轮面试后,HR打电话问是否接受第五轮面试,当时已经签了别的公司offer,就拒绝了。

       一面:问了项目细节,项目中使用的分类模型MobileNet的细节,做的是几分类。之后又问了Faster RCNN的RPN部分完整的工作流程,我对于RPN理解得不好,而面试官问得很细,所以在此处就开始崩盘了。最后问了我一道Leetcode上的代码题:buy and sell stocks II,我当时leetcode刷的太少,思路也没打开,所以没有写出来。

       二面:只问了两道算法题,第一道是buy and sell stocks I,第二道此处记忆有些模糊,但两道题难度都不是很大,我很快地解决了。

       三面:问了在哪保研、可以保证的实习时长,还有Precision、Recall值的计算,问了我之前做的一个OCR识别项目的细节,又问是如何评判该项目最终识别的精度。接下来问了两道算法题,第一道是找出数组中出现频次超过数组长度一半的那个数(剑指Offer中的一道题),第二道是求n级阶梯跳青蛙问题(剑指Offer中的跳台阶问题的扩展题),两道题难度都适中,我都做了出来,但是第一道没有给出最优解。算法题问完后,又问了一道简单的log函数的图像绘制问题,大概是高中数学的难度,比较水。随后问了Yolo v3和Yolo v2的区别,同时问到了为什么Yolo v3的Softmax会变为二分类Logistic,这个地方我没有想过,所以没有答好。后来又要求我介绍下NMS算法以及问Softmax函数是如何推导的,Softmax的物理含义。

       四面:四面是电话面,一共就是三道问题,第一道问的是典型的面试题--三门问题;第二道道问的是求最大值的期望的问题,是大学概率论中的题型;最后一道是算法题,要求从非递减的float型序列中找到目标数值的下标范围(貌似也是剑指Offer中的问题)。

       总的来说,Momenta的视觉岗位实习生的标准要求还是蛮高的,他们更注重的是深度而不是广度,同时Momenta公司很喜欢考查算法题,题目大多为剑指Offer和Leetcode上easy到medium难度的题目。

       爱奇艺:只面了一轮现场面,面试未通过。

       爱奇艺的面试开局就很不顺利,自己因为滴滴上打了拼车迟到半小时,给面试官的第一印象就很差。面试中首先进行项目介绍,接着面试官问了OCR识别这一块的工作以及对于OCR中使用到的算法的理解,我提到了CTPN以及CRNN算法,但这两个算法我都只是了解了梗概的部分,具体细节理解得并不好,回答得也不怎么样。接下来就是一些常用检测模型的询问,竟然被问到了Overfeat模型,我只知道这是14年左右的一篇论文中提到的算法,但是细节还是说不清…面试官转而又询问Yolo系列,这一块我勉强过关。最后问到了和Faster RCNN的区别,比如为什么Faster RCNN精读高一些,为什么Yolo速度快一些这类的问题。

       整体而言,爱奇艺的面试官在CV领域的理解比较深入,同时对于实习生的水平要求也很高,他对于简历上CV相关的工作都要求讲出所有的细节。

       旷视:现场面试了两轮,当晚收到了录取通知。

       一面:一共就问了两道算法题,旷视有白板可以直接在上面手写代码。第一道是视觉中典型的IoU值的计算问题,第二道是给定一个二维数组的bounding box,再给一个target bounding box,要求找到大于0.9的IOU值对应的bounding box,感觉这道题可能是实际场景中遇到的一道题目,我一开始就明确了是二分查找的思路,但是细节处理得很有问题。

       二面:二面面试官是做项目经理这种类型的,没有问到任何技术细节,主要是问了我做过的项目的流程、梗概这些,其中也穿插着对于旷视公司的吹捧,员工能力的分布,总之二面给我的心理挫败很大…

       回顾我的旷视面试,可能是因为刚好我面的组缺人,所以整个面试过程问到的理论细节并不是很多,也算是赶巧了orz。

 

       我的面试经历大致就是这些,因为自己只是刚入CV坑的本科渣渣,所以也没有多余的建议给大家,还是希望大家多多学习,多刷算法题吧!

本课程适合具有一定深度学习基础,希望发展为深度学习之计算机视觉方向的算法工程师和研发人员的同学们。基于深度学习的计算机视觉是目前人工智能最活跃的领域,应用非常广泛,如人脸识别和无人驾驶中的机器视觉等。该领域的发展日新月异,网络模型和算法层出不穷。如何快速入门并达到可以从事研发的高度对新手和中级水平的学生而言面临不少的挑战。精心准备的本课程希望帮助大家尽快掌握基于深度学习的计算机视觉的基本原理、核心算法和当前的领先技术,从而有望成为深度学习之计算机视觉方向的算法工程师和研发人员。本课程系统全面地讲述基于深度学习的计算机视觉技术的原理并进行项目实践。课程涵盖计算机视觉的七大任务,包括图像分类、目标检测、图像分割(语义分割、实例分割、全景分割)、人脸识别、图像描述、图像检索、图像生成(利用生成对抗网络)。本课程注重原理和实践相结合,逐篇深入解读经典和前沿论文70余篇,图文并茂破译算法难点, 使用思维导图梳理技术要点。项目实践使用Keras框架(后端为Tensorflow),学员可快速上手。通过本课程的学习,学员可把握基于深度学习的计算机视觉的技术发展脉络,掌握相关技术原理和算法,有助于开展该领域的研究与开发实战工作。另外,深度学习之计算机视觉方向的知识结构及学习建议请参见本人CSDN博客。本课程提供课程资料的课件PPT(pdf格式)和项目实践代码,方便学员学习和复习。本课程分为上下两部分,其中上部包含课程的前五章(课程介绍、深度学习基础、图像分类、目标检测、图像分割),下部包含课程的后四章(人脸识别、图像描述、图像检索、图像生成)。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值