2020算法秋招面经

最新推荐文章于 2024-03-30 16:48:29 发布

一种tang两种味

最新推荐文章于 2024-03-30 16:48:29 发布

阅读量2.4k

点赞数 6

文章标签：自然语言处理机器学习算法人工智能

本文链接：https://blog.csdn.net/GFDGFHSDS/article/details/109133833

版权

2020.7.24 腾讯一面 40min

先做个自我介绍吧

xgboost 怎么计算特征重要性？？前5层是什么？？怎么排序特征重要性的？？

bert的结构，过程详细讲一下

你的项目中bert重新训练了吗？讲一下具体过程。你在哪弄的服务器？

输入是什么？？emebedding+seg+pos三者相加还是级联，维度变了吗？

postional encoding是怎么设计的？绝对位置还是相对位置？为什么这么设计？

BERT被设计用来处理长度为512的输入序列。作者通过让BERT学习每个位置的向量表示来包含输入序列的顺序特征。这意味着Position嵌入层是一个大小为(512,768)的查找表，其中第一行是第一个位置上的任意单词的向量表示，第二行是第二个位置上的任意单词的向量表示，等等。因此，如果我们输入“Hello world”和“Hi there”，“Hello”和“Hi”将具有相同的Position嵌入，因为它们是输入序列中的第一个单词。同样，“world”和“there”的Position嵌入是相同的。

token嵌入，形状(1,n, 768)，这只是词的向量表示
Segment嵌入，形状(1,n, 768)，这是向量表示，以帮助BERT区分成对的输入序列。
Position嵌入，形状(1,n, 768)，让BERT知道其输入具有时间属性。

对这些表示进行元素求和，生成一个形状为(1,n, 768)的单一表示。这是传递给BERT的编码器层的输入表示。

self-attention机制详细讲一下。

spark中action和transformation区别是什么？？spark的惰性计算是什么/？

1.transformation是得到一个新的RDD，方式很多，比如从数据源生成一个新的RDD，从RDD生成一个新的RDD

2，action是得到一个值，或者一个结果（直接将RDDcache到内存中）

所有的transformation都是采用的懒策略，就是如果只是将transformation提交是不会执行计算的，计算只有在action被提交的时候才被触发。

从运行层面来看，Transformation实际上是一种链式的逻辑Action，记录了RDD演变的过程。Action则是实质触发Transformation开始计算的动作，由于在每个Transformation的过程中都有记录，所以每个RDD是知道上一个RDD是怎样转变为当前状态的，所以如果出错就可以很容易的重新演绎计算过程。

一个完整的RDD任务由两部分组成：Transformation和 Action。Transformation用于对RDD的创建，还可以把老的RDD通过Transformation来生成新的RDD。例如，map就是一种transformation操作，它用于将已有RDD的每个元素传入一个自定义的函数，并得到一个新的元素，然后将所有的新元素组成一个新的 RDD。但RDD一大特性是延迟（lazy）计算，即纵使你执行这些Transformation操作，这些操作也不会执行。换句话说， transformation操作不会触发spark程序执行的，它们只是先记录了对RDD所做的一系列操作，只有之后碰上一个action操作，那么前面所有的transformation才会执行。collect和reduce就是action操作。

lstm中输入维度是5，隐含层维度是20，序列长度是10，一个计算单元怎么算的，维度是多少？

那讲一下lstm吧，三个门，那三个门的维度怎么算的？？？

超参数的个数计算如下：假设inputsize为 [公式] ，hidden_size为，不使用peephole，bidirectional，且使用bias。输入门，输出门，遗忘门和cell_state参数个数均为。总参数个数为

4 * 【20*（5+20）+20】

2020.7.29 华为一面 1h 20min

自我介绍 – 可以，讲的简明扼要哈。。要求扎实的综合能力。学习能力。我不介意你的专业，公司会有点介意，但是跨界大佬很多，你的对手是他们，你要怎样打败他们。我们是粤港澳优招。

扎实的基础数据结构与算法：分而治之和减而知之，知道下标为10，求链表，数组，二叉树的复杂度

链表，二叉树，堆，栈等的存、取数据的时间复杂度:参考：https://www.jianshu.com/p/8f1d8d1ed82d

讲一下你对机器学习的理解，优劣势，和趋势？？

讲一下你的学习历程。

手撕代码：求最长公共子串的长度及打印出所有最长公共子串。半小时

如果不能做nlp算法，有其他研发岗位你愿意做吗？先有广度，积累，再谈深度。

不只是会用机器学习算法，原理也懂点，还要更加会用于工业场景，如何应用？？？

你有什么想要知道的吗？

2020.8.1 深信服大牛批一面 40min

自我介绍

获得过什么奖学金，排名。

神经网络激活函数，各自优缺点

讲一下实习项目的过程吧，bert怎么用进来的，

讲一下LDA，（项目里面写了）

手撕代码；成绩排名输出。

2020.8.4 华为二面1h

自我介绍，重点介绍下项目经验。

问了项目中rouge，LDA，dilicret分布，项目中评判分数好坏的标准。（项目里面写了）

你为什么转nlp？优势？

手撕：给你一个数组，让它变为5*5矩阵，然后顺时针螺旋输出，并最后变为数组打印出来！要求复杂度低。

2020.8.5 贪心科技一面 1h

手撕：编辑距离，快速排序+归并排序+归排序三选一

快排最差的时间复杂度，快排怎么优化？n2，随机快速排序，，，

哈希表怎么实现的？哈希函数原理？？怎么防止冲突？链表法最差时间复杂度，怎么优化？？

动态数据流中，怎么记录最大的k个数，要求空间复杂度最低，我说用栈，那怎么具体操作？两个栈怎么维持？

还可以用堆，那你堆的复杂度怎么计算？

rf和gbdt的区别与联系？从方差和偏差角度？？gbdt里面怎么计算梯度的？？

word2vec原理？？相比one-hot两个优势在哪里？反义词如男和女的相似度是多少，为啥是正1，不是-1，

有一个缺陷：同义词与反义词的上下文是相近的，因此有着相似的词向量，但两者语义差别很大，作者提出了一种方法改善

word2vec怎么来的？？比tf-ifdf好在哪里？

word2vec怎么训练的？最终输出的是什么？？给一个文本给你，怎么用word2vec训练？？

你项目里讲到LDA，你讲一下LDA吧，狄利克雷分布是啥？？

HMM的两个假设是？？？齐次morkov假设：t时刻的状态只与t-1的状态有关，观测独立性假设：任意时刻的观测只依赖于该时刻的morkov连状态，与其他观测及状态无关。

交叉熵的公式是什么？？为啥要用交叉熵？

2020.8.10 贪心科技二面 1h

上来手撕：所有最长递增子序列中字典序和最小的序列，合并两个排序的链表（过去了45分钟。。）

自我介绍，你的职业规划？？你为什么选nlp？？

二叉树的遍历方式？？后序遍历的非递归怎么操作？？跟右左反转

你讲一个你掌握的机器学习算法吧。transformer、、、挑了最难的、、

transformer的encoder和decoder区别？？他为啥比rnn好？rnn存在什么问题？？为啥transformer不会梯度消失？transformer 的multi-head代码怎么实现的？如果词嵌入768维，multi-head后是多少？

self-attention的复杂度是多少？为什么是n2d，d代表什么？？n是序列序列的矩阵，d是词嵌入维度n<<d就很快，并行是在哪里？

你有什么要问我的吗？

首先，6个大的模块之间是串行的，一个模块计算的结果做为下一个模块的输入，互相之前有依赖关系。

从每个模块的角度来说，注意力层和前馈神经层这两个子模块单独来看都是可以并行的，不同单词之间是没有依赖关系的。当然对于注意力层在做 attention 的时候会依赖别的时刻的输入，不过这个只需要在计算之前就可以提供。然后注意力层和前馈神经层之间是串行，必须先完成注意力层计算再做前馈神经层。

2020.8.18 字节一面 1h

自我介绍

你用什么语言？c++和python区别？

bert怎么取第三层的？你做了哪些？只是fine-tune？mean-max-pooling，bert跑了多少轮？

讲讲项目里的banditsum，

手撕：最长上升子序列！

你有什么要问我的吗？

2020.8.21 阿里一面 50min

自我介绍

项目里面的文本生成指什么，具体说说。LDA你说说，你怎么聚合中心句的？lda是判别模型吗？

你讲讲text-rank，权重怎么修改的？最大边缘相关算法。bert怎么微调的？？

说说强化学习的回报函数，机制是啥？怎么计算回报的？

bert中的mean-max-pooling模型是啥？为啥要用l2不用l1，为啥不直接用cls？？

手撕：不重复子集！有没有更简单的方法？？

你有什么要问我的吗？

2020.8.25 美团一面 1h

自我介绍。项目实习介绍。项目的来源。bert的结构、过程。竞赛的人数，贡献。

bert改进的模型有哪些？

django 与flask区别、get和post区别

有看过模型上线后的并发量吗？用户的访问量吗？

tf-idf公式、linux怎么查看python任务ps -ef |grep python、linux怎么查看gpu使用情况lspci | grep -i nvidia

梯度消失？？怎么解决？？

lgb与xgb区别、xgb与gbdt区别

pytorch的矩阵乘法、矩阵点积，点乘。叉乘。逆矩阵。中心极限定理。大数定理。

pytorch怎么设置显卡数，驱动cuda装过吗？

batch-normalization作用

python的装饰器生成器迭代器，线程与进程区别。进程调度的方法。tcp三次握手。

hashmap，hash散列表

手撕：mysql输出所有表1中A的购物记录。

你目前面试过哪些公司？你家是上饶哪里的？？

你有什么要问我的吗？

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-t3UN0Eu9-1602920451505)(C:\Users\VULCAN\AppData\Roaming\Typora\typora-user-images\image-20200825161315268.png)]

2020.9.1 华宇一面25min

问项目+实习

2020.9.3 多益网络一面43min

自我介绍

项目介绍

讲一下textrank

对fine-tune的理解，还有其它方式吗？

决策树的构造过程

为啥要用交叉熵不用最小均方差？

tfidf缺点

fasttext的优缺点

什么情况下考虑分词？

以概率P产生0，概率(1-P)产生1，请问能否利用这个随机数发生器，构造出新的发生器，以12的概率产生0和1，请写明结论及推理过程。

你怎么互联网公司普遍加班的？？对加班995的看法；

你有什么要问我的吗？

2020.9.7 多益网络二面hr面 18min

Q1.自我介绍
Q2.了解多益网络吗,为什么投多益

神武梦想世界相继大成，最让我欣赏的是多益其实是未雨绸缪，居安思危，对研发投入很大，可以为我提供一个广阔的平台，学到真正的技术，可以实现自己的人生价值，希望我也能进入多益，为多益的发展做出一些贡献！
Q3.最认同多益网络的三点：个人发展前景。公司平台和氛围，能否真正学到技术。
Q4.认为产品经理必备的三点品质：同理心、沟通能力、逻辑能力
Q5.你这三点品质怎么样：
Q6.团队合作能力怎么样？在团队中的角色？为什么没当组长
Q8.说一个工作或生活中遇到的困难的事情，怎么解决的？
Q11.如果上司让你周末替他取快递但你计划去健身，为什么选择“不高兴但还是去做”？如果不是取快递而是工作上的事情呢？
Q12.为什么不支持二胎政策
Q13.为什么想到广州？父母支持吗？我有女朋友，就在广州！
Q14.还收到那些公司的面试通知

Q15.怎么看待996或者加班

我个人觉得适当加班是必要的，特别是做自己喜欢做的项目时候，就是项目能激励我们，而不是被迫去做这些事，而且我现在需要花更多的时间去积累经验，去学习。

很多人都喜欢优先的工作，但我觉得优先会使人堕落，我希望能够实现自己的目标，人生价值，我愿意付出更多的努力去奋斗，我很乐意接受这样的工作，，我读研9 111 7，读研也很辛苦，但是我都坚持下来了！在实习。。。有付出才有回报。

Q16. 反问环节：在多益的工作体验怎么样，觉得多益怎么样？公司相关的业务以及主要i的业务是在几块？？

投了那些公司，面了那些offer，有没有兄弟姐妹，父母对你有哪些期望？

三个词岗位优点，缺点：效率高，有干劲，刻苦i抗压，性格开朗，责任心强。不注重穿着，不善于拒绝别人，有时会忽略细节。·

一次团队合作的经历，自己担任什么角色：

怎么看待其他人，拖后腿的人：态度问题，能力问题？

期望薪资：经过我从其他渠道的一些了解，我觉得15k左右可以接受的

加班薪资：个人会期望公司适当有点补助，或者其他的奖励。

目前有到谈薪的公司吗：没有

怎么和组里人协作：

1.共同的目标du；.相互信任；强烈的责任感；了解团队成员的性格品质，团队强调的是协同工作，所以团队的工作气氛很重要，它直接影响团队的工作效率。没有完美的个人，在一个团队中，每个成员都有自己的优点缺点。作为团队的一员应该主动去寻找团队成员的优点和积极品质，学习它，并克服自己的缺点和消极品质，让它在团队合作中被弱化甚至被消灭。如果团队的每位成员，都主动去寻找其它成员的积极品质，那么团队的协作就会变得很顺畅，工作效率就会提高。

怎么看待组里人：和睦相处，做知心朋友，家

举个例子讲一下你遇到的困难，怎么解决的：

领导给你一个方案，但你有更好的方案怎么办：

遇到这种情况，我首先要想清楚我的这个方案是真的好还是只是我认为好，因为作为一个领导，站得高看得远，在宏观上对一个问题的把握更加的全面，看问题更加的透彻，对方案的执行情况看的也更远，所以，我要站在一个更高的层次来评估我的这个方案，同时要注意我的方案的可执行性。

其次，我会找一个合适的时间与部门的其他同事，特别是老同志加强交流，听听他们的意见。在综合考虑的基础上，如果我觉得我的这个方案还是比较好的话，那么我会找一个恰当的时间，私下里把我的这个方案报给领导，并把我认为我的这个方案的好的地方着重提出来供领导参考。当然，最终的方案是由领导来定夺的。我相信，领导会很高兴看到他的下属向他提建议的。而作为一个下属，在工作中，如果有不同的意见，也应该负责任的通过合适的方式把自己的想法向领导反映，这是构建一个和谐有效团队的基础。

怎么看待中国二胎政策：缓解老龄化，抑制男女比例失衡。但是同时增大了就业压力，加重个人家庭负担，在如今高物价时代，同时子女的教育也成了问题。我个人看来，二胎政策只是放款了要求，至于要不要生二胎，还是看个人还有他的家庭情况，我自己的话倾向于生一胎，这样可以留给更多的时间给工作和生活，也不会有很大的压力吧。

公司线上出了问题，你会回来帮助解决吗: 这是必须的，公司的利益也关乎个人的利益，

父母对你工作的期望：有一个很好的工作，有一番作为！

平衡生活与工作：

提高工作效率。工作时就全身心投入工作中去。高效率的完成任务。不将工作带到生活中去。
明确自己的人生目标。努力工作是为了提高生活品质更好的生活
因此明确自己的人生目标，确定每个时期的重点。达到工作和生活的平衡。
学会生活，放松身心。利用假期给自己的身心放个假。和家人、朋友一起出游。休息时好好休息，不要被工作打扰。
当自己或家人身体出现问题。不论多么重要的工作都要先暂停。身体健康更加重要。

2020.9.10 美的一面 30min

自我介绍，项目介绍。

为什么转nlp？怎么学的？看过哪些书？？

常见激活函数，sigmoid和relu优缺点。

怎么吧图像中识别出来的错别字进行矫正？比如美的没有识别出来怎么矫正？用nlp的方法。

怎么比较两个字符串的不同？不用深度学习。

2020.9.12 1:30 亚控科技一面 30min

自我介绍，项目介绍

你知道我们公司是做什么的吗？

你的期望薪资？

你能解接受出差吗？

你对岗位地点的要求。

你有什么要问我的吗？

2020.9.12 2:40 深信服正式批一面 30min

自我介绍，你为啥转算法？为啥研究生还在学材料？

transformer 和rnn，lstm这些的区别在哪里，好在哪里？

bert和gpt区别，gpt3哪里进行了改进？不用微调，Bert和gpt2需要微调。

你讲一下你对传统机器学习和深度学习的理解吧。

你有什么要问我的吗？

手撕代码（共享屏幕）：组合总和2

2020.9.12 3:30 同花顺一面 30min

线程与内存地址。

有1-2n个座位，要求夫妻坐一起，有几种方式？？

n对夫妇任意在一排2n个椅子上就坐,有(2n)!种坐法.若所有夫妇都相邻,把夫妇两人看做一个整体,有n!种坐法

两人可互相交换座位,所以共2^{n*n!种故“有夫妇不相邻的”的概率为1-2}n*n!/(2n)!=1-1/(2n-1)!

2个人掷硬币，第一个人抛出正面硬币的概率是多少？

把两个人各抛一次硬币记作一轮游戏，第一个人正面发生在：第一轮的概率1/2 第二轮的概率(1/2)^3 第三轮的概率1/21/21/21/21/2 …… 一直进行下去，按等比数列求和（1/2-0）/（1-1/4）=2/3.

机器学习的基本流程?

缺失值怎么处理

你有没有从0-1实现过深度学习的某个模型？

如何看待adaboost和rf？区别？哪个能并行？

常见分类传统机器学习模型及其应用场景？

过拟合和欠拟合。分别怎么解决？为啥l1能使数据稀疏？

从一个二维矩阵中搜索一个字符串，怎么做？时间复杂度是多少？

2020.9.14 11:00 深信服二面 20min

自我介绍，

项目的难点，怎么解决的

如果有100w个域名，怎么检查是否符合拼写规范？

你觉得n-gram可行吗？真不会

你有没有遇到过工程化方面的问题？

2020.9.15 11:00 瑛太莱一面 1h15min

自我介绍，然后开始了，由机器学习到NLP再到项目。

你介绍下基本的线性模型有哪些？

你介绍下LR和SVM区别，

SVM核函数有哪些？核函数有啥作用？

HMM介绍下，CRF介绍下

HMM怎么用于分词，怎么做的？参数怎么求？

CRF可以用于哪些场景？

命名实体识别你知道吗？怎么做的？

介绍下rnn

lstm比rnn好在哪？具体怎么实现的？

lstm中输入维度是10，输出层是维度20，一个计算单元怎么算的，维度是多少？

你知道那些聚类方法？？

kmeans优缺点？？怎么优化，你听过kmeans++吗？k值怎么确定？

介绍下cnn，cnn卷积层池化层有啥作用？

cnn, 怎么用到text里？？textcnn。

你讲下textcnn

你讲下word2vec，word2vec怎么得到词嵌入向量的？怎么计算的？

介绍下transformer

余弦相似度和欧氏距离的比较？？

lstm-attention，有几类？你讲下attention机制

介绍下transformer，怎么实现残差的？残差有啥作用？

介绍下self-attention。

你讲下layerNormalization吧，BN和LN特点？如果BN太小，会怎样？为啥？

bert在transformer做了那些改进

问完技术问项目：

具体讲一下你的实习项目吧，文本摘要生成？？怎么优化加速？

听过Kd tree吗？

你讲下你的关于bert分类的项目吧，bert有几个transformer block

AUC是啥？和F1 score区别？为啥能适用于不平衡样本？

反问环节：有几面？？公司目前的主要业务板块有哪些？智能客服，聊天机器人，机器翻译。跨境电商。

2020.9.16 网宿科技一面 30min

操作系统+计网+数据库+数据结构与算法

线程间的通信，哪种最快？

类的继承？super用过吗？

数组和链表的区别？优缺点？

链表中有1234一共4个节点，已经知道2的地址，怎么在O（1）复杂度内删除这个2节点？

常见排序算法，快速排序的思路？

怎么优化快速排序中选基准数？

python的GIL锁，为啥有这个锁，其它语言就没有？

python装饰器？

tcp和udp区别及应用场景？

数据库中主键和外键是啥？

手撕：有效括号。

2020.9.17 同花顺二面 30min

自我介绍，项目介绍

具体谈项目

2020.9.18 苏宁一面 13min

自我介绍，项目介绍

具体谈项目

你知道attention有哪些吗？

2020.9.19 13:45 融360一面 30min

自我介绍，项目介绍

我们不搞nlp，我说我搞ML也可以

说一下bert

位置编码有哪些方式？

xgboost和gbdt区别

LR为啥用对数似然函数，

你做过哪些关于数据处理的工作？

ID3，C4.5，CART区别？除了信息增益这些。

手撕：最长上升子序列。

2020.9.19 14:50 融360二面 30min

xgboost怎么计算特征重要性，怎么排序的？

什么是梯度消失，怎么解决？使用 ReLU、LReLU、ELU、maxout 等激活函数 ,使用批规范化 残差结构

xgboost怎么并行的？xgboost有哪些重要参数需要调？树的深度一般几层？

你说话平时都这么快吗？

手撕：股票最大利润，只能购买和卖出一次

手撕：圆圈中最后剩下的数字

你linux熟吗？

会sql吗？手撕：从表中找出每门课都大于80分的学生姓名。

熟悉map reduce吗？map reduce遇到数据不平衡怎么处理？

团队协作？个人优劣势？

2020.9.19 16:05 融360三面hr面 30min

你遇到的困难，

你认为材料和计算机的相关性？材料对你的帮助。

项目是你主导完成的吗？团队怎么协作？

你的优缺点。

你的期望薪资

你的期望工作地点。

你有没有压力比较大的时候？

实习怎么进的那家公司?

2020.9.22 16:05 平安科技一面 30min

bert的缺点及改进方法，问项目。手撕：求众数。

2020.9.24 微步在线一面 40min

偏差和方差，降维方法，集成方法，xgboost 优点，神经网络模型，优化方法，word2vec，skip-gram，字典树深度学习框架，二叉搜索树，最大的k个数，数组中只有一个数字出现了一次，其他偶数次。排序算法有哪些，hadoop，linux查找某个文件的某个特定字，知道吗，反问。

2020.9.25 微步在线二面 40min

深挖项目简历，最后你有什么要补充的吗？

2020.9.29 11：00跟谁学一面 30min

深挖项目简历LDA，textrank，bert，语言模型定义，transformer，self-attention，multid-head作用学习到字，词，不同语法结构的信息表示，不同空间映射，bert怎么用于句子嵌入。

2020.9.29 17：00 途虎养车二面 30min

深挖项目简历：LDA输出的是概率，怎么拿来进行主题分析，textrank怎么迭代计算权重，bert结构，

2020.9.29 18：30 微步在线三面 20min

2020.9.30 瑛太莱二面 30min

2020.9.30 微步在线四面hr面 25min

你的缺点，你为啥从材料转算法，你的业余活动，你的性格，你的团队协作，你有啥要问的吗？

2020.10.9 万得一面 60min

参考：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GOlpu65Z-1602920451506)(C:\Users\VULCAN\AppData\Roaming\Typora\typora-user-images\image-20201007202117234.png)]

2020.10.9 万得二面 50min

二面问的同一面差不多，问项目较深，深挖简历。

2020.10.12 得物一面 30min

问项目，提取关键信息的模型有哪些，梯度下降为啥能使损失函数下降最快？？正则化的一些方法？？有啥作用？应用场景？

2020.10.15

收到微步在线的电话，谈薪资！2020.10.16正式收到offer，

2020.11.6

收到融360加薪的电话，很诱人！微步也给加薪了，不过最后还是决定去融360了。

总结

怎么说呢？部分大厂都给面试机会了，互联网大厂包括字节腾讯阿里美团，可能是我太菜了，一面后就挂了（没消息了也认为是挂了）。华为挂在二面。然后中厂包括同花顺，苏宁，平安科技，深信服等都挂在二面了，苏宁和深信服给我的二面面试体验贼差，不想面就别给面试机会啊，搞人心态是什么意思？上一秒说不是很懂下一秒就变脸了？？这种10来分钟就结束的不用想就是凉透了。然后剩下的主要是一些小厂了，途虎养车，二面挂，多益网络hr面挂，被卡专业了吧，瑛太莱hr面被放鸽子了，给我说有更好的人选了，气不气，剩下的基本没消息了。、

总体这么多面试下来，不知不觉的提升，表达能力，对各方面知识的理解能力也都提升了，希望未来也能越来越好！！！