2020.7.24 腾讯一面 40min
先做个自我介绍吧
xgboost 怎么计算特征重要性??前5层是什么??怎么排序特征重要性的??
bert的结构,过程详细讲一下
你的项目中bert重新训练了吗?讲一下具体过程。你在哪弄的服务器?
输入是什么??emebedding+seg+pos三者相加还是级联,维度变了吗?
postional encoding是怎么设计的?绝对位置还是相对位置?为什么这么设计?
BERT被设计用来处理长度为512的输入序列。作者通过让BERT学习每个位置的向量表示来包含输入序列的顺序特征。这意味着Position嵌入层是一个大小为(512,768)的查找表,其中第一行是第一个位置上的任意单词的向量表示,第二行是第二个位置上的任意单词的向量表示,等等。因此,如果我们输入“Hello world”和“Hi there”,“Hello”和“Hi”将具有相同的Position嵌入,因为它们是输入序列中的第一个单词。同样,“world”和“there”的Position嵌入是相同的。
- token嵌入,形状(1,n, 768),这只是词的向量表示
- Segment嵌入,形状(1,n, 768),这是向量表示,以帮助BERT区分成对的输入序列。
- Position嵌入,形状(1,n, 768),让BERT知道其输入具有时间属性。
对这些表示进行元素求和,生成一个形状为(1,n, 768)的单一表示。这是传递给BERT的编码器层的输入表示。
self-attention机制详细讲一下。
spark中action和transformation区别是什么??spark的惰性计算是什么/?
1.transformation是得到一个新的RDD,方式很多,比如从数据源生成一个新的RDD,从RDD生成一个新的RDD
2,action是得到一个值,或者一个结果(直接将RDDcache到内存中)
所有的transformation都是采用的懒策略,就是如果只是将transformation提交是不会执行计算的,计算只有在action被提交的时候才被触发。
从运行层面来看,Transformation实际上是一种链式的逻辑Action,记录了RDD演变的过程。Action则是实质触发Transformation开始计算的动作,由于在每个Transformation的过程中都有记录,所以每个RDD是知道上一个RDD是怎样转变为当前状态的,所以如果出错就可以很容易的重新演绎计算过程。
一个完整的RDD任务由两部分组成:Transformation和 Action。Transformation用于对RDD的创建,还可以把老的RDD通过Transformation来生成新的RDD。例如,map就 是一种transformation操作,它用于将已有RDD的每个元素传入一个自定义的函数,并得到一个新的元素,然后将所有的新元素组成一个新的 RDD。但RDD一大特性是延迟(lazy)计算,即纵使你执行这些Transformation操作,这些操作也不会执行。换句话说, transformation操作不会触发spark程序执行的,它们只是先记录了对RDD所做的一系列操作,只有之后碰上一个action操作,那么前 面所有的transformation才会执行。collect和reduce就是action操作。
lstm中输入维度是5,隐含层维度是20,序列长度是10,一个计算单元怎么算的,维度是多少?
那讲一下lstm吧,三个门,那三个门的维度怎么算的???
超参数的个数计算如下:假设inputsize为 ,hidden_size为 ,不使用peephole,bidirectional,且使用bias。输入门,输出门,遗忘门和cell_state参数个数均为 。总参数个数为
4 * 【20*(5+20)+20】
2020.7.29 华为一面 1h 20min
自我介绍 – 可以,讲的简明扼要哈。。要求扎实的综合能力。学习能力。我不介意你的专业,公司会有点介意,但是跨界大佬很多,你的对手是他们,你要怎样打败他们。我们是粤港澳优招。
扎实的基础数据结构与算法:分而治之和减而知之,知道下标为10,求链表,数组,二叉树的复杂度
链表,二叉树,堆,栈等的存、取数据的时间复杂度:参考:https://www.jianshu.com/p/8f1d8d1ed82d
讲一下你对机器学习的理解,优劣势,和趋势??
讲一下你的学习历程。
手撕代码:求最长公共子串的长度及打印出所有最长公共子串。半小时
如果不能做nlp算法,有其他研发岗位你愿意做吗?先有广度,积累,再谈深度。
不只是会用机器学习算法,原理也懂点,还要更加会用于工业场景,如何应用???
你有什么想要知道的吗?
2020.8.1 深信服大牛批 一面 40min
自我介绍
获得过什么奖学金,排名。
神经网络激活函数,各自优缺点
讲一下实习项目的过程吧,bert怎么用进来的,
讲一下LDA,(项目里面写了)
手撕代码;成绩排名输出。
2020.8.4 华为二面1h
自我介绍,重点介绍下项目经验。
问了项目中rouge,LDA,dilicret分布,项目中评判分数好坏的标准。(项目里面写了)
你为什么转nlp?优势?
手撕:给你一个数组,让它变为5*5矩阵,然后顺时针螺旋输出,并最后变为数组打印出来!要求复杂度低。
2020.8.5 贪心科技一面 1h
手撕:编辑距离,快速排序+归并排序+归排序三选一
快排最差的时间复杂度,快排怎么优化?n2,随机快速排序,,,
哈希表怎么实现的?哈希函数原理??怎么防止冲突?链表法最差时间复杂度,怎么优化??
动态数据流中,怎么记录最大的k个数,要求空间复杂度最低,我说用栈,那怎么具体操作?两个栈怎么维持?
还可以用堆,那你堆的复杂度怎么计算?
rf和gbdt的区别与联系?从方差和偏差角度??gbdt里面怎么计算梯度的??
word2vec原理??相比one-hot两个优势在哪里?反义词如男和女的相似度是多少,为啥是正1,不是-1,
有一个缺陷:同义词与反义词的上下文是相近的,因此有着相似的词向量,但两者语义差别很大,作者提出了一种方法改善
word2vec怎么来的??比tf-ifdf好在哪里?
word2vec怎么训练的?最终输出的是什么??给一个文本给你,怎么用word2vec训练??
你项目里讲到LDA,你讲一下LDA吧,狄利克雷分布是啥??
HMM的两个假设是???齐次morkov假设:t时刻的状态只与t-1的状态有关,观测独立性假设:任意时刻的观测只依赖于该时刻的morkov连状态,与其他观测及状态无关。
交叉熵的公式是什么??为啥要用交叉熵?
2020.8.10 贪心科技二面 1h
上来手撕:所有最长递增子序列中字典序和最小的序列,合并两个排序的链表(过去了45分钟。。)
自我介绍,你的职业规划??你为什么选nlp??
二叉树的遍历方式??后序遍历的非递归怎么操作??跟右左反转
你讲一个你掌握的机器学习算法吧。transformer、、、挑了最难的、、
transformer的encoder和decoder区别??他为啥比rnn好?rnn存在什么问题??为啥transformer不会梯度消失?transformer 的multi-head代码怎么实现的?如果词嵌入768维,multi-head后是多少?
self-attention的复杂度是多少?为什么是n2d,d代表什么??n是序列序列的矩阵,d是词嵌入维度n<<d就很快,并行是在哪里?
你有什么要问我的吗?
首先,6个大的模块之间是串行的,一个模块计算的结果做为下一个模块的输入,互相之前有依赖关系。
从每个模块的角度来说,注意力层和前馈神经层这两个子模块单独来看都是可以并行的,不同单词之间是没有依赖关系的。当然对于注意力层在做 attention 的时候会依赖别的时刻的输入,不过这个只需要在计算之前就可以提供。然后注意力层和前馈神经层之间是串行,必须先完成注意力层计算再做前馈神经层。
2020.8.18 字节一面 1h
自我介绍
你用什么语言?c++和python区别?
bert怎么取第三层的?你做了哪些?只是fine-tune?mean-max-pooling,bert跑了多少轮?
讲讲项目里的banditsum,
手撕:最长上升子序列!
你有什么要问我的吗?
2020.8.21 阿里一面 50min
自我介绍
项目里面的文本生成指什么,具体说说。LDA你说说,你怎么聚合中心句的?lda是判别模型吗?
你讲讲text-rank,权重怎么修改的?最大边缘相关算法。bert怎么微调的??
说说强化学习的回报函数,机制是啥?怎么计算回报的?
bert中的mean-max-pooling模型是啥?为啥要用l2不用l1,为啥不直接用cls??
手撕:不重复子集!有没有更简单的方法??
你有什么要问我的吗?
2020.8.25 美团一面 1h
自我介绍。项目实习介绍。项目的来源。bert的结构、过程。竞赛的人数,贡献。
bert改进的模型有哪些?
django 与flask区别、get和post区别
有看过模型上线后的并发量吗?用户的访问量吗?
tf-idf公式、linux怎么查看python任务ps -ef |grep python、linux怎么查看gpu使用情况lspci | grep -i nvidia
梯度消失??怎么解决??
lgb与xgb区别、xgb与gbdt区别
pytorch的矩阵乘法、矩阵点积,点乘。叉乘。逆矩阵。中心极限定理。大数定理。
pytorch怎么设置显卡数,驱动cuda装过吗?
batch-normalization作用
python的装饰器生成器迭代器,线程与进程区别。进程调度的方法。tcp三次握手。
hashmap,hash散列表
手撕:mysql输出所有表1中A的购物记录。
你目前面试过哪些公司?你家是上饶哪里的??
你有什么要问我的吗?
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-t3UN0Eu9-1602920451505)(C:\Users\VULCAN\AppData\Roaming\Typora\typora-user-images\image-20200825161315268.png)]
2020.9.1 华宇 一面25min
问项目+实习
2020.9.3 多益网络 一面43min
自我介绍
项目介绍
讲一下textrank
对fine-tune的理解,还有其它方式吗?
决策树的构造过程
为啥要用交叉熵不用最小均方差?
tfidf缺点
fasttext的优缺点
什么情况下考虑分词?
以概率P产生0,概率(1-P)产生1,请问能否利用这个 随机数发生器,构造出新的发生器,以12的概率产生0和1,请写明结论及推理过程。
你怎么互联网公司普遍加班的??对加班995的看法;
你有什么要问我的吗?
2020.9.7 多益网络 二面hr面 18min
Q1.自我介绍
Q2.了解多益网络吗,为什么投多益
神武梦想世界相继大成,最让我欣赏的是多益其实是未雨绸缪,居安思危,对研发投入很大,可以为我提供一个广阔的平台,学到真正的技术,可以实现自己的人生价值,希望我也能进入多益,为多益的发展做出一些贡献!
Q3.最认同多益网络的三点:个人发展前景。公司平台和氛围,能否真正学到技术。
Q4.认为产品经理必备的三点品质:同理心、沟通能力、逻辑能力
Q5.你这三点品质怎么样:
Q6.团队合作能力怎么样?在团队中的角色?为什么没当组长
Q8.说一个工作或生活中遇到的困难的事情,怎么解决的?
Q11.如果上司让你周末替他取快递但你计划去健身,为什么选择“不高兴但还是去做”?如果不是取快递而是工作上的事情呢?
Q12.为什么不支持二胎政策
Q13.为什么想到广州?父母支持吗?我有女朋友,就在广州!
Q14.还收到那些公司的面试通知
Q15.怎么看待996或者加班
我个人觉得适当加班是必要的,特别是做自己喜欢做的项目时候,就是项目能激励我们,而不是被迫去做这些事,而且我现在需要花更多的时间去积累经验,去学习。
很多人都喜欢优先的工作,但我觉得优先会使人堕落,我希望能够实现自己的目标,人生价值,我愿意付出更多的努力去奋斗,我很乐意接受这样的工作,,我读研9 111 7,读研也很辛苦,但是我都坚持下来了!在实习。。。有付出才有回报。
Q16. 反问环节:在多益的工作体验怎么样,觉得多益怎么样?公司相关的业务以及主要i的业务是在几块??
投了那些公司,面了那些offer,有没有兄弟姐妹,父母对你有哪些期望?
三个词岗位优点,缺点:效率高,有干劲,刻苦i抗压,性格开朗,责任心强。不注重穿着,不善于拒绝别人, 有时会忽略细节。·
一次团队合作的经历,自己担任什么角色:
怎么看待其他人,拖后腿的人:态度问题,能力问题?
期望薪资:经过我从其他渠道的一些了解,我觉得15k左右可以接受的
加班薪资:个人会期望公司适当有点补助,或者其他的奖励。
目前有到谈薪的公司吗:没有
怎么和组里人协作:
1.共同的目标du;.相互信任;强烈的责任感;了解团队成员的性格品质,团队强调的是协同工作,所以团队的工作气氛很重要,它直接影响团队的工作效率。没有完美的个人,在一个团队中,每个成员都有自己的优点缺点。作为团队的一员应该主动去寻找团队成员的优点和积极品质,学习它,并克服自己的缺点和消极品质,让它在团队合作中被弱化甚至被消灭。如果团队的每位成员,都主动去寻找其它成员的积极品质,那么团队的协作就会变得很顺畅,工作效率就会提高。
怎么看待组里人:和睦相处,做知心朋友,家
举个例子讲一下你遇到的困难,怎么解决的:
领导给你一个方案,但你有更好的方案怎么办:
遇到这种情况,我首先要想清楚我的这个方案是真的好还是只是我认为好,因为作为一个领导,站得高看得远,在宏观上对一个问题的把握更加的全面,看问题更加的透彻,对方案的执行情况看的也更远,所以,我要站在一个更高的层次来评估我的这个方案,同时要注意我的方案的可执行性。
其次,我会找一个合适的时间与部门的其他同事,特别是老同志加强交流,听听他们的意见。在综合考虑的基础上,如果我觉得我的这个方案还是比较好的话,那么我会找一个恰当的时间,私下里把我的这个方案报给领导,并把我认为我的这个方案的好的地方着重提出来供领导参考。当然,最终的方案是由领导来定夺的。我相信,领导会很高兴看到他的下属向他提建议的。而作为一个下属,在工作中,如果有不同的意见,也应该负责任的通过合适的方式把自己的想法向领导反映,这是构建一个和谐有效团队的基础。
怎么看待中国二胎政策:缓解老龄化,抑制男女比例失衡。但是同时增大了就业压力,加重个人家庭负担,在如今高物价时代,同时子女的教育也成了问题。我个人看来,二胎政策只是放款了要求,至于要不要生二胎,还是看个人还有他的家庭情况,我自己的话倾向于生一胎,这样可以留给更多的时间给工作和生活,也不会有很大的压力吧。
公司线上出了问题,你会回来帮助解决吗: 这是必须的,公司的利益也关乎个人的利益,
父母对你工作的期望:有一个很好的工作,有一番作为!
平衡生活与工作:
- 提高工作效率。工作时就全身心投入工作中去。高效率的完成任务。不将工作带到生活中去。
- 明确自己的人生目标。努力工作是为了提高生活品质更好的生活
- 因此明确自己的人生目标,确定每个时期的重点。达到工作和生活的平衡。
- 学会生活,放松身心。利用假期给自己的身心放个假。和家人、朋友一起出游。休息时好好休息,不要被工作打扰。
- 当自己或家人身体出现问题。不论多么重要的工作都要先暂停。身体健康更加重要。
2020.9.10 美的 一面 30min
自我介绍,项目介绍。
为什么转nlp?怎么学的?看过哪些书??
常见激活函数,sigmoid和relu优缺点。
怎么吧图像中识别出来的错别字进行矫正?比如美的没有识别出来怎么矫正?用nlp的方法。
怎么比较两个字符串的不同?不用深度学习。
2020.9.12 1:30 亚控科技 一面 30min
自我介绍,项目介绍
你知道我们公司是做什么的吗?
你的期望薪资?
你能解接受出差吗?
你对岗位地点的要求。
你有什么要问我的吗?
2020.9.12 2:40 深信服正式批 一面 30min
自我介绍,你为啥转算法?为啥研究生还在学材料?
transformer 和rnn,lstm这些的区别在哪里,好在哪里?
bert和gpt区别,gpt3哪里进行了改进?不用微调,Bert和gpt2需要微调。
你讲一下你对传统机器学习和深度学习的理解吧。
你有什么要问我的吗?
手撕代码(共享屏幕):组合总和2
2020.9.12 3:30 同花顺 一面 30min
线程与内存地址。
有1-2n个座位,要求夫妻坐一起,有几种方式??
n对夫妇任意在一排2n个椅子上就坐,有(2n)!种坐法.若所有夫妇都相邻,把夫妇两人看做一个整体,有n!种坐法
两人可互相交换座位,所以共2n*n!种故“有夫妇不相邻的”的概率为1-2n*n!/(2n)!=1-1/(2n-1)!
2个人掷硬币,第一个人抛出正面硬币的概率是多少?
把两个人各抛一次硬币记作一轮游戏,第一个人正面发生在: 第一轮的概率1/2 第二轮的概率(1/2)^3 第三轮的概率1/21/21/21/21/2 …… 一直进行下去, 按等比数列求和 (1/2-0)/(1-1/4)=2/3.
机器学习的基本流程?
缺失值怎么处理
你有没有从0-1实现过深度学习的某个模型?
如何看待adaboost和rf?区别?哪个能并行?
常见分类传统机器学习模型及其应用场景?
过拟合和欠拟合。分别怎么解决?为啥l1能使数据稀疏?
从一个二维矩阵中搜索一个字符串,怎么做?时间复杂度是多少?
2020.9.14 11:00 深信服 二面 20min
自我介绍,
项目的难点,怎么解决的
如果有100w个域名,怎么检查是否符合拼写规范?
你觉得n-gram可行吗?真不会
你有没有遇到过工程化方面的问题?
2020.9.15 11:00 瑛太莱 一面 1h15min
自我介绍,然后开始了,由机器学习到NLP再到项目。
你介绍下基本的线性模型有哪些?
你介绍下LR和SVM区别,
SVM核函数有哪些?核函数有啥作用?
HMM介绍下,CRF介绍下
HMM怎么用于分词,怎么做的?参数怎么求?
CRF可以用于哪些场景?
命名实体识别你知道吗?怎么做的?
介绍下rnn
lstm比rnn好在哪?具体怎么实现的?
lstm中输入维度是10,输出层是维度20,一个计算单元怎么算的,维度是多少?
你知道那些聚类方法??
kmeans优缺点??怎么优化,你听过kmeans++吗?k值怎么确定?
介绍下cnn,cnn卷积层池化层有啥作用?
cnn, 怎么用到text里??textcnn。
你讲下textcnn
你讲下word2vec,word2vec怎么得到词嵌入向量的?怎么计算的?
介绍下transformer
余弦相似度和欧氏距离的比较??
lstm-attention,有几类?你讲下attention机制
介绍下transformer,怎么实现残差的?残差有啥作用?
介绍下self-attention。
你讲下layerNormalization吧,BN和LN特点?如果BN太小,会怎样?为啥?
bert在transformer做了那些改进
问完技术问项目:
具体讲一下你的实习项目吧,文本摘要生成??怎么优化加速?
听过Kd tree吗?
你讲下你的关于bert分类的项目吧,bert有几个transformer block
AUC是啥?和F1 score区别?为啥能适用于不平衡样本?
反问环节:有几面??公司目前的主要业务板块有哪些?智能客服,聊天机器人,机器翻译。跨境电商。
2020.9.16 网宿科技 一面 30min
操作系统+计网+数据库+数据结构与算法
线程间的通信,哪种最快?
类的继承?super用过吗?
数组和链表的区别?优缺点?
链表中有1234一共4个节点,已经知道2的地址,怎么在O(1)复杂度内删除这个2节点?
常见排序算法,快速排序的思路?
怎么优化快速排序中选基准数?
python的GIL锁,为啥有这个锁,其它语言就没有?
python装饰器?
tcp和udp区别及应用场景?
数据库中主键和外键是啥?
手撕:有效括号。
2020.9.17 同花顺 二面 30min
自我介绍,项目介绍
具体谈项目
2020.9.18 苏宁 一面 13min
自我介绍,项目介绍
具体谈项目
你知道attention有哪些吗?
2020.9.19 13:45 融360一面 30min
自我介绍,项目介绍
我们不搞nlp,我说我搞ML也可以
说一下bert
位置编码有哪些方式?
xgboost和gbdt区别
LR为啥用对数似然函数,
你做过哪些关于数据处理的工作?
ID3,C4.5,CART区别?除了信息增益这些。
手撕:最长上升子序列。
2020.9.19 14:50 融360二面 30min
xgboost怎么计算特征重要性,怎么排序的?
什么是梯度消失,怎么解决?使用 ReLU、LReLU、ELU、maxout 等激活函数 ,使用批规范化 残差结构
xgboost怎么并行的?xgboost有哪些重要参数需要调?树的深度一般几层?
你说话平时都这么快吗?
手撕:股票最大利润,只能购买和卖出一次
手撕: 圆圈中最后剩下的数字
你linux熟吗?
会sql吗?手撕:从表中找出每门课都大于80分的学生姓名。
熟悉map reduce吗?map reduce遇到数据不平衡怎么处理?
团队协作?个人优劣势?
2020.9.19 16:05 融360三面hr面 30min
你遇到的困难,
你认为材料和计算机的相关性?材料对你的帮助。
项目是你主导完成的吗?团队怎么协作?
你的优缺点。
你的期望薪资
你的期望工作地点。
你有没有压力比较大的时候?
实习怎么进的那家公司?
2020.9.22 16:05 平安科技一面 30min
bert的缺点及改进方法,问项目。手撕:求众数。
2020.9.24 微步在线一面 40min
偏差和方差,降维方法,集成方法,xgboost 优点,神经网络模型,优化方法,word2vec,skip-gram,字典树深度学习框架,二叉搜索树,最大的k个数,数组中只有一个数字出现了一次,其他偶数次。排序算法有哪些,hadoop,linux查找某个文件的某个特定字,知道吗,反问。
2020.9.25 微步在线二面 40min
深挖项目简历,最后你有什么要补充的吗?
2020.9.29 11:00跟谁学一面 30min
深挖项目简历LDA,textrank,bert,语言模型定义,transformer,self-attention,multid-head作用学习到字,词,不同语法结构的信息表示,不同空间映射,bert怎么用于句子嵌入。
2020.9.29 17:00 途虎养车二面 30min
深挖项目简历:LDA输出的是概率,怎么拿来进行主题分析,textrank怎么迭代计算权重,bert结构,
2020.9.29 18:30 微步在线三面 20min
2020.9.30 瑛太莱二面 30min
2020.9.30 微步在线四面hr面 25min
你的缺点,你为啥从材料转算法,你的业余活动,你的性格,你的团队协作,你有啥要问的吗?
2020.10.9 万得一面 60min
参考:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GOlpu65Z-1602920451506)(C:\Users\VULCAN\AppData\Roaming\Typora\typora-user-images\image-20201007202117234.png)]
2020.10.9 万得二面 50min
二面问的同一面差不多,问项目较深,深挖简历。
2020.10.12 得物一面 30min
问项目,提取关键信息的模型有哪些,梯度下降为啥能使损失函数下降最快??正则化的一些方法??有啥作用?应用场景?
2020.10.15
收到微步在线的电话,谈薪资!2020.10.16正式收到offer,
2020.11.6
收到融360加薪的电话,很诱人!微步也给加薪了,不过最后还是决定去融360了。
总结
怎么说呢?部分大厂都给面试机会了,互联网大厂包括字节腾讯阿里美团,可能是我太菜了,一面后就挂了(没消息了也认为是挂了)。华为挂在二面。然后中厂包括同花顺,苏宁,平安科技,深信服等都挂在二面了,苏宁和深信服给我的二面面试体验贼差,不想面就别给面试机会啊,搞人心态是什么意思?上一秒说不是很懂 下一秒就变脸了??这种10来分钟就结束的不用想就是凉透了。然后剩下的主要是一些小厂了,途虎养车,二面挂,多益网络hr面挂,被卡专业了吧,瑛太莱hr面被放鸽子了,给我说有更好的人选了,气不气,剩下的基本没消息了。、
总体这么多面试下来,不知不觉的提升,表达能力,对各方面知识的理解能力也都提升了,希望未来也能越来越好!!!