校招|我的秋招记录——(自然语言处理-面经+感悟)

作者:Haitons

链接:https://www.nowcoder.com/discuss/348316 

来源:牛客网

回忆这东西若是有气味的话,那就是樟脑的香 ————谨以此文记录我的2019秋招~

自我介绍

    北京某末流211本硕,本科前三年基本都在混日子,现在想想当时真够堕落的,早晨第一节课基本不去,上课去了也是玩手机,没课就是在宿舍打游戏+睡觉+各种玩,考试临时突击混个及格,基本没学到什么东西。后来在生活中遇到了一些事情,下定决心要改变自己,最后考上了本校的研究生。

    在这里奉劝本科还在学习阶段的同学,一定要好好学专业知识!!!我自己上了研究生之后就发现自己的基础相比于其他同学就很薄弱,计算机的基础很重要,这些东西都是方方面面的,想在以后再去弥补,将要花费好几倍的时间与精力。所以至少在大学计算机的专业课要认真听!业余时间可以学些课外的知识提高自己。

    我研究生的研究方向是自然语言处理,主要做的是文本生成的相关工作,所以秋招找的主要是算法岗,没有实习经历,只有一篇中文的论文(水)+垃圾比赛(重在参与),在8月底改完英文论文投出后才开始准备秋招,所以特别被动。

    虽然如今一篇好论文已经并不能成为公司录用的关键,但至少可以保证简历并不是那么难看,不至于简历就被刷......实习也很重要,能实习的同学尽量要出去实习,首先实习转正也是一条出路,其次也会给你的简历和面试加分不少。

    像我这样又没论文又没实习的就吃了不少憋,秋招投了大概70+的互联网,10+的国企和银行,最后只有6家互联网公司给了面试,太难了.....秋招过程中有一段时间心态崩溃,饭也吃不下,觉也睡不好,最后也算熬过去了。接下来总结一下自己秋招的经历,希望可以帮到大家。

1.简历:简历一定要好好做,不要无脑全部列上去,可以参考剑指Offer上的STAR原则。

2.刷题:刷题很重要,剑指offer必刷!!!由于自己秋招准备的比较晚,LeetCode我只刷了100道左右,有时间的还是应该早准备,刷的越多越好。刷完题之后要多做总结,错题每隔一段时间再做一遍。我把剑指offer的所有题还有Leetcode一些重要的,自己经常错的题都写在纸上了,每次面试前都翻看一遍,面试的机会很宝贵,没做过的题只能看现场发挥,但是做过的题一定要保证不出错!!!

3.基础知识(算法岗):数据结构与算法(简单复习一下),机器学习算法基础可以看西瓜书、统计学习方法、百面机器学习。常用的机器学习算法知识一定要掌握,手推LR、SVM、反向传播也要准备一下。还有就是要掌握深度学习NLP或者CV方面的一些必备知识。

4.项目:项目一定要讲的熟练,要说清项目解决了什么问题,使用了什么方法(引申出的知识点一定要会),自己的职责,遇到的困难等。

5.实习和比赛:有时间的一定要去实习!!!工业界一些Spark和hadoop的项目经历会为面试加分不少。比赛的话要明白自己方法的不足,前几名队伍使用了什么方法,自己在比赛中收获了什么。

6.心态:秋招是一个漫长的战役,心态很重要。我自己心情不好时喜欢看猫和老鼠来减压,实在扛不住了就去操场跑几圈。作为菜鸡(大佬忽视),挂了很正常,要调整好心态,总结每次面试遇到的一些问题,有针对性的弥补。该吃吃,该喝喝 ,别瞎想,要把心思都用在复习上。

面经 小红书 2019.09.08 二面挂 从8月10号第一个笔试一直到9月8号才有第一个面试,菜鸡太难了....而且由于秋招开始准备的太晚,当时复习的很仓促,好多知识点都没复习到就去了,二面GG。

一面 1h    

    1.数组和链表的效率,增删改查?

    2.讲讲哈希表

    3.代码:二叉树的四种遍历

    4.介绍快速排序+代码

    5.代码:链表的逆序,两个链表找公共交点

    6.代码:两个栈实现一个队列

    第一次面试真的太紧张了,小红书特别重视基础,一面+二面就没看我的简历,都是问基础+手撕代码。好多基础的东西就是因为没有打牢固,虽然知道,了解,但就是说不到点上。而且我当时剑指offer都没全看完,头天看书还看到两个栈实现队列这题了,但我刚好跳过去没看。。。好在现场手撕还是撕出来了,但是回去看书发现自己的思路还是有些冗余。

二面 30min 给定一个int数组,求数组中能组成三角形的个数。

一面问完感觉惊魂未定,没过几分钟就二面了,没想到二面也没问简历,上来就是撕代码。

    这道题是Leetcode原题,当时已经12点多了,我每写一点那个面试官就要打断我的思路,问一下这句在干啥?时间复杂度多少?本来当时就紧张,脑子也蒙了,后来直接写了个O(n^3)的暴力法。然后面试官也没说啥,就开始了反向提问环节,然后出来我就挂了,看着面试官开心的吃饭去了。。。。

    虽然挂了心里还是有点难受,但是这次面试也吸取了不少经验和教训吧。回去砸了几天数据结构,后来又刷了两遍剑指offer,继续准备之后的笔试。

科大讯飞 2019.09.21 走完二面挂

    开始以为小红书之后很快会有下次的面试,结果发现自己还是太Naive了,又做了两周的笔试才接到科大讯飞的面试,差点就顶不住了。不过没有面试的这段时间也给自己留下了宝贵的复习时间。这次基础,项目,算法也准备的差不多了,在面试的时候就明显自信了很多。

一面 40min 

    1.自我介绍,问项目

     2.你做文本生成用的什么损失函数?写一下交叉熵的公式 

    3.Attention机制的原理

     4.Adam了解吗?写一下Adam的公式

     5.树模型怎么剪枝?如何处理缺失值?说了一大段,后来回去才发现说成了随机森林中处理缺失值的方法了。

    6.Python生成器介绍,Python不可变数据类型有哪些?由于自己现在用Python比较多,面试官问了我一些Python的基础知识,不可变数据类型没答上来,所以对于自己使用的语言里的一些基础知识还是应该要了解的。

    7.代码题:按照一个对象的属性A进行降序排序

  1. 意向地点是哪里?可以接受调换工作地点吗?

二面 30min 

1.自我介绍,讲讲做了哪些项目 

2.项目的目的是是什么,解决了什么问题?团队的情况,在团队中的角色

3.简历里写的比赛介绍一下,你们是怎么做的,取得了什么成绩?CRF了解吗?

比赛里用到了CRF,当时没太了解原理。所以对于项目和比赛中用到的方法一定要了解,要不然就不要提!

4.有了解前几名队伍用的什么方法吗?你觉得参加比赛收获了什么?5.聊天

    二面算是半技术面+半HR面,面试官应该是个领导,不过全程的氛围很轻松。第一次走完流程很开心,以为八九不离十了,结果十一放假回来就收到了感谢信。。。。

58同城 2019.09.24 二面+Hr (offer) 面完讯飞之后没几天就去面58了,不得不说面58的人真是够多的。。。而且很轻松就能走完流程。

一面 45min

    1.自我介绍,讲讲你的优点是什么

    2.讲项目,数据哪里来的,你负责的是什么?

    3.问比赛,解决了什么问题,数据格式是什么样的,前几名的方法有了解吗

    4.58有很多非结构化的数据信息,如何实现高效的信息抽取?

    5.如果你拿到的数据是没有标签信息的,应该怎么办?

    6.如果我们进行一个分类任务,某些数据有缺失值怎么办?

    7.如何将某个特征值变换到0-1之间?特征归一化的方法有哪些?为什么要进行归一化?

    8.数组和链表的使用场景

一面的面试官应该是搞数据的,不太懂NLP,全程都是问的数据方面的问题。场景题感觉自己答得一般,特征工程自己了解的也不多,感觉问题都出在这部分。

二面 20 min

    1.自我介绍,讲讲项目吧。为什么要做生成任务,而不是直接从数据库中进行抽取?

    2.你们这个比赛做的是什么?

    3.问问代码吧,看之前笔试的卷子。你这个是用set去重做的,如果不用set怎么办?

    4.第二个题,重复率100%讲讲啥原因吧,再写一下

    5.嗯,没啥问的了

    58面试人太多了,上午面完等了半天,吃完午饭1点半回来等到快4点了才二面。。。。当时我一进去看到我的二面面试官心里就有点慌,一看就是个大佬,气场太强了。

    后来面试完去58招聘首页,发现二面面试官在首页的员工故事那里,是个10年的大佬。。。。大佬怼了一下我的项目和比赛,就拿出之前笔试的卷子在那看。。。然后特别尴尬的事情就是第二道代码题查重100%,因为当时和实验室同学一起做的,互帮互助了一下。大佬让我解释一下什么原因,我也就直接说了,后来他让我现场又写了一遍,写出来之后他也没说啥。。。。开始以为自己肯定凉了,没想到大佬还是放了我一马。。

三面 Hr 20min

    1.自我介绍,你负责了哪些项目,团队情况,分工情况 2.有发论文吗?为什么没去实习?3.如果能来58工作,你最想从事哪方面的工作?为什么?4.现在有哪些offer,聊天

    Hr面特别轻松和愉快,也没有啥套路性的问题。第一次58开奖没开到我,一直到11月6号才给我捞起来。

    滴滴 2019.10.14 三面 (offer) 十一放假前觉得58和科大讯飞至少能拿一个,结果两个都凉了,心态崩了。那段日子应该是整个秋招最困难的时期了,每天都很焦虑,一度特别怀疑自己。整个9月就面了三家,看不到什么希望。感谢滴滴给我了机会,虽然当时觉得可能机会不大,但是不试试怎么知道呢?尽力就好了也没什么可遗憾的。

一面 1h30min

    1.自我介绍,聊项目

    2.想没想过文本生成用强化学习怎么做?

    3.Wordvec的原理讲一下,画出CBOW和Skip-gram的模型图

    4.Word2vec用的两个Trick是什么?为什么要做层次Softmax,负采样是怎么实现的?

    5.讲讲Glove的原理,它和Word2vec有什么区别?Fasttext说一下

    6.画LSTM模型图,写LSTM的公式

    7.讲讲CNN,它和LSTM有什么区别

    8.Transformer介绍一下

    9.画一下ELMo的模型图,讲一下ELMo的原理,为什么它能解决词歧义的问题?

    10.画Bert的模型图,讲原理,预训练的过程。Bert输入是由哪些组成的?Bert相比于ELMo有什么优点?它是怎么用作下游任务的?

    11.Attention机制的原理,常用的Attention计算相似度方式有哪些,写一下公式。

    12.CRF的原理

    13.有分布式训练神经网络的经验吗?多卡跑模型的命令是什么?

    14.代码题:数组中索引K前面是有序的,K之后也是有序的,调整使得整个数组有序,要求空间复杂度O(1)

    我是下午5点半去面试的,到了之后工作人员给我们每个人准备了晚餐盒饭,吃完之后心态放轻松了很多。滴滴的面试还是很有水平的,一面的时候知识点抠的很细,自己的发挥没什么大问题。

二面 1h 

    1.自我介绍,你本科是物联网的?当时为什么要学物联网?主要学了哪些课程?讲讲物联网的应用还有你对物联网的看法。

    这个问题我是真的没预料到。。。。不过老本行还是难不倒我的。2.聊项目,解决了什么问题?你们团队是怎么分工的,有几个人,你主要负责什么?

    3.围绕项目一顿怼。。。。

    4.你的评价指标是什么?讲讲ROUGE和BLEU

    5.写出Wordvec在负采样下的目标函数 这个没写上来。。。。

    6.又抠了一便Transformer,为什么Transformer要比LSTM的效果好?你的工作为什么用GRU没用Transformer?

    7.传统机器学习方法了解吗?问了问SVM和GBDT

    8.代码题,有一个M*N的矩阵,每一格有一个正整数,将>=K的连续格子聚类到一起

    二面代码差点没写上来,一开始听到这个题就觉得要凉,在这儿为二面面试官点赞,当时已经8点多了,旁边的面试官面完了还在催他一起走,不过他还是很负责任,一直耐心的等我,最后静下心来还是做出来了。

三面 40min

    1.自我介绍,讲了一遍项目

    2.你这个项目解决了什么问题,有什么意义?为什么说它可以提高词向量的可解释性?

    3.讲讲Bert为什么效果好

    4.智力题:ABCD乘以9等于DCBA,那么ABCD各等于几?

    5.代码题:有1,2,5,10,20,50的纸币,求凑到100元一共有多少种方法

    三面面试官很年轻,一上来和我说我前两面的分数还挺高,我还没来得及高兴,他又说现在HC比较少了,如果没有什么特色的话也不会给offer。。。。智力题解出A之后,面试官说我思路对了,数算错了。代码写完之后面试官跟我说在他这给我通过了,但是之后HR还要进行筛选。

    面完已经快10点了,走的时候只有我和另一个北邮大佬了。不管结果怎么样,走完流程还是很开心的,这次面试真的把我的全部都发挥出来了,让自己的心理和自信这方面提升了一大截。

    之后一直等到11月5号才收到滴滴的OC,中间也拿到了工行和人寿的offer,为了等滴滴把工行给拒了。后来马蜂窝开奖还是没开到我,有种互联网一路陪跑的感觉。那几天又是特别难熬,实验室的同学也都上岸了,就剩自己一个人了。后来想想如果当时马蜂窝给我offer我肯定就签马蜂窝了。不过一直有和北邮老哥还有牛客上的同学交流,确认滴滴还一直还没开。5号刚收到百信的电话,立马就收到滴滴的OC了,当时特别开心,一切的付出都是值得的。

    马蜂窝 2019.10.20 2面+HR 挂 经历完滴滴面试之后,自己心态轻松了很多,马蜂窝的技术面体验特别好。面试过程感觉在和朋友聊天一样,最后二面还和面试官开起了玩笑。

一面 1h

    1.自我介绍

    2.讲项目

    3.Spark, Hadoop了解吗?

    4.数据库了解吗?

    5.linux系统了解吗,Shell脚本掌握程度

    6.缓解过拟合的方法有哪些?从特征的角度讲讲怎么做?

    7.特征离散化

    8.BN、LN,写公式

    9.讲讲L1正则化、L2正则化

    10.哪些模型不用做归一化

    11.ELMo的原理,和word2vec相比有什么区别

    12.讲讲Attention机制,self-attention有什么不同点?

    13.代码题:合并两个有序链表,合并K个有序链表

二面 1h 

    1.项目中的数据怎么来的?原始数据格式什么样的?做了哪些数据预处理?送到网络前数据的格式是什么样的?词义消歧是怎么做的?

    2.如果神经网络里只有RELU的话,可以拟合任何分布吗?

    3.场景题,一个doc里有很多图片和一些短文本,怎样获得有用的信息?

    4.从文本中得到的向量表示不如图片中的信息丰富,怎么办?

    5.Bert原理

    6.马蜂窝有一批旅游的数据,怎么样使得Bert适用于我们的场景?

    7.讲讲Dropout,为什么dropout有效

    8.常用的评价指标有哪些?混淆矩阵,写出P,R,F1的公式。如果我现在想让评价指标更偏向召回率的话,应该怎么做?

    9.NLP中怎么做推荐的?Bert可以应用于推荐系统吗?

    10.NLP中怎么做摘要的,如果给定一篇长文档,怎么进行摘要的生成?

    11.多任务学习,多模态学习

    12.讲讲GBDT、XGBoost

    13.讲讲牛顿法,SGD、动量、Adagrad、RMSprop、Adam。Adam为什么效果这么好?写一下公式,顺便我还说了说最近的Radam和Lookahead

    14.谈谈你对神经网络的理解,为什么神经网络的表现这么好?

    15.代码:一道数据处理题,将文件中同一用户ID的数据合并在一起

三面 Hr 30min

    1.自我介绍

    2.为什么没去实习?

    我说因为自己的论文没写完,结果HR问我为什么不能随便发一篇。。。。3.最有成就的事是什么,生活和学习上?

    4.你最大的优点和缺点是什么?

    5.为什么要来马蜂窝,对面试职位的看法。

    马蜂窝的HR算是我遇到过的最咄咄逼人的HR,全程被怼的够呛。我当时说自己大学校运会800米,1500米第二,足球是院队的但是水平只能当替补,她说你没发现你干啥都不是最好的吗?我也是无语了。还有当时也没太准备一些套路的问题,像缺点这种最好还是不要说大实话。

    面完以为马蜂窝肯定稳了,回去心情不错,还请同学吃了火锅,结果开奖还是没有我。技术面感觉没啥大问题,估计HR面被刷了吧。

     互联网只面了以上五家(百信银行算是半个互联网吧),菜鸡真的是连个面试都混不上,太难了。为了不失业也投了一些国企和银行,后面是一些面经。其实国企和互联网也挺好的,轻松、稳定,而且女生挺多的(哈哈)。不过自己还是选择了先去互联网闯闯,希望以后上班之后还能有时间做些自己喜欢的事吧。

    百信银行 面试+线下笔试+技术面试 +行长面试 (offer) 百信银行算是半个互联网公司吧,之前对百信的了解不深。但是整个秋招接触下来留给我的印象很好。数分和算法岗都不错,技术肯定比传统的银行要强很多。

一面 2019.10.19 一轮无领导小组讨论+一轮HR面

第一次去面试上来就是一轮无领导小组讨论,6进2,之后以为是技术面,结果是一轮HR面,然后回去通知之后有一次线下的集中笔试。

线下笔试 2019.10.25

    1.计算CNN网络中一层的参数量

    2.画LSTM的结构图,说说LSTM与GRU的特点,为什么它们的效果优于RNN

    3.简述一种中文分词算法。

    4.二分类模型(大部分正例)在训练集上效果好,在测试集上效果差,从数据的角度解释原因,如何解决。

    5.一个系统可以进行闲聊和订票,设计其算法模块。

    6.代码:顺时针打印矩阵

    技术面 2019.10.26 1.Word2vec算法,特点,缺点 2.聊项目,如何衡量词向量的语义信息,可解释性相关。

线下笔试做完有一轮技术面,通过后安排了行长面。

    行长面(群面) 2019.10.27 这个是真的百信银行行长面试!!!形式也是群面,大家每个人依次回答,行长也讲了银行的一些业务和规划,然后就回去等消息了,据说行长面也挂了40%的人,我在11月5号收到了offer。

1.自我介绍 2.最有成就的事情 3.优点,缺点是什么 4.推荐一本书

我推荐的是史铁生的《我与地坛》,带给我很多感悟和感动的一本书。

    工商银行科技菁英提前批(offer) 9月27号一面群面,10月13线下笔试,10月22第二次面试也是群面。

    线下笔试考的都是计算机相关题目,还有3道编程题,不过只能用C++和Java,好久没写C++了,函数名想不起来了,只做出来一道。所以如果想找银行技术岗的同学语言多复习C++和Java。面试群面每个人会被问到一些技术方面的问题,还有就是一些特定的场景题了。

    更玄学的是第二次面试有个面试官还问了我对最近NBA事件的看法,还有自己为什么喜欢健身这种问题。。。。。。

    中国人寿研发中心(offer) 2019.10.18 一轮无领导小组讨论+一轮领导面,领导面简单问了问技术和开发语言。

    一路秋招最多的可能就是辛酸和无奈吧,好事多磨,庆幸自己坚持下来了。感谢实验室的同学和几个朋友的鼓励,还有每天刷牛客看到大家的面经和分享,陪我度过了最艰难的一段时期。付出了就不会后悔,希望大家最后都能有个好结果!

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值