说起1、2月,绝对算得上求职者的黄金准备期。传说中的金三银四和校园春招都马上要到来了,相信有准备的朋友们已经开始刷题了,今天就为大家分享一篇字节跳动的真实面经:
字节电商&垂直策略部nlp算法工程师面经分享
第一次面的字节电商下的智能客服组,主要做对话生成,部门的技术涉及到知识图谱以及多轮对话生成。一二面面试官都问得比较深,懂的东西也很多,对单纯的背八股回答不感兴趣,喜欢应试者有自己的思考。三面面试官面试的时候一直在看手机回消息,有时候根本没在听,最终三面不出所料地挂掉了。
一面
1. 详细介绍EMNLP的论文
a) 比BERT好在哪?某种attention,以及实现一定程度的信息跨句传播
b) 标注的细节?
c) 可否处理未见事件
2. 介绍文本表示方法:
One-hot,词袋模型,神经网络word2vec,w2v负采样,BERT的多头attention作用(面试官不喜欢背八股,喜欢有自己的思考,讨论了多头attention可以关注到一个小部分的信息,比如100/1000维,单独处理前100维不会使之被后面的轻易average掉)
3. 做题:二分查找
反问:字节电商下的抖音电商,业务有知识图谱和对话结构化。知识图谱主要针对抖音电商商家所填信息不完整的情况,和标题填一大堆引流的情况。
二面
1. 详细介绍EMNLP论文
a) Tensor-composition的具体过程,为什么work
b) 事件比attention好在哪里?</