2023秋招面经
本2硕9,一篇EMNLP一作,一篇C会一作,在投A会一篇也是一作(阿里妈妈实习做的)
秋招算法岗,简历被挂麻了,最后好在拿了几个offer,算法岗没论文还是不建议来卷了!
有论文都有点难卷
科大讯飞
提前批一面
- 介绍论文
- 模型参数大小,用的计算资源
- 模型压缩怎么做?除了知识蒸馏
- 对不定长的序列怎么处理,pad
- 一个batch的数据长度方差比较大或者大部分pad为0,非常稀疏,排序的时候把等长的排到一块,怎么处理
- 自回归和自编码的优缺点对比
- 怎么把自回归和非自回归的结合起来?
- 怎么理解静态mask和动态mask
- 机器学习,HMM和SVD有了解吗?
- 目前写过的整个project最多代码大概多少行
提前批一面挂,转正式批
正式批一面
纯聊天
- 你的优点和缺点是什么
- 你的职业规划是怎么样的
- 你五年后会成为什么样的人
快手商业化
快手商业化一面
- 自我介绍
- 做题,全排列
- 如果nums有重复怎么办,怎么改
- 上飞机问题,100个乘客,100个座位,第一个乘客随机坐一个位置,后面每个人上来如果座位被占了,就会随机坐一个位置,没被占的话就坐自己的位置,求第100个人坐到自己位置的概率?
- 约会配对问题,有男生侧和女生侧,怎么设计一个系统对全局男生和全局女生得到最好的配对解,即男女产生like的概率越高
- 分类指标AUC,pre,recall,F1
- 线下AUC很好,线上AUC不高的可能原因?
- 如何缓解过拟合问题?
- 介绍项目
- 实际的提升有多大,主要提升在哪个方面?
快手商业化二面
- 自我介绍
- 介绍项目
- 项目的创新点
- 有上线测试吗,实际的增量
- 过拟合问题怎么缓解
- BN和LN
- BN训练和推理的时候的区别,BN推理的时候怎么保证infer样本为1的时候的量纲
- L1和L2正则化的区别
- 会C和C++吗?最好用C刷题,链表题,(C太久没用了,只会python)
- 做题,链表的快速排序(不会,写了数组版本的)
- 一个单链表,不知道长度,遍历一次的时间开销是不可容忍的,怎么随机采样m个节点的概率保证每个节点被采样到的概率都是相同的
- 一个二维数组,行升序,列升序,怎么快速找到想要找到的数 ,时间复杂度是多少?
商业化二面挂
快手推荐一面(被捞)
- 全程问论文实习
- 代码题:
- 判断单链表是否有环
- 找出环的入口和总长度
快手推荐二面
- 全程问论文实习
- 你的职业规划
- 代码题:
- 括号回溯
- 两个有序数组的中位数,要求Olog(m+n) hard
只写出来O(m+n)
推荐二面挂
字节正式批
字节商业化一面:
- 全程问实习,整个流程,有点打听项目思路的感觉
- 问题,热门item和冷门item学到的embedding L2范数有什么差别
- LR和MLP去掉激活函数是线性还是非线性
- 代码题,要求找出和为target的所有组合数下标,数字可以相同,只要有一个下标不同即可
字节一面挂
百度提前批
百度商业化一面:
全程问论文实习
- 论文一,具体细节输入输出
- 论文二,区别,贡献点,具体输入输出,loss
- 实习,怎么做的
做题:
后序遍历非递归
中序遍历非递归
百度商业化二面:
- 全程问论文实习,各种细节,loss怎么算
- 场景题,对广告做预估,特征,流程怎么做
- 概率题,一个苹果,先扔硬币扔到正面的吃苹果,先扔的人吃苹果的概率
- 代码题,最长括号匹配连续长度
- 代码题,最长上升子序列长度,非连续
百度商业化三面:
- 全程问论文实习
- 你觉得自己做的项目怎么扩展
百度已offer
小红书
小红书商业化一面:
手撕代码:
- 给一个n,生成1-n的一个排列,使得排列的元素,前后两两相加为一个数的平方
- 给定K个长度为N的有序数组,求合并后有序的数组
实习:
3. 问实习
4. GCN原理,GAT原理
5. 图学习的优点,与双塔对比的优点
已挂
OPPO
OPPO机器学习一面:
- 无手撕代码,面试官不开摄像头,感觉是kpi
- 纯聊项目
聊完挂
携程
携程搜索推荐一面:
- 介绍论文
- 召回阶段和word2vec的联系
- word2vec的负采样以及分层softmax
- 图embedding和你的图学习的区别有了解吗?
- 代码题:
判断两个字典是否相同,字典中的元素可能还是个字典,并输出字典元素不同的键和值
已挂
小米:
小米机器学习一面:
- 介绍论文
- 阿里妈妈实习
- 介绍NLP
- 机器学习模型了解哪些
- 说一说你项目的创新点
- 做题,
- 链表环的起点
- 公交车上下车问题,查分数组
- 快速排序
小米机器学习二面
- 介绍论文
- 阿里妈妈实习
- 介绍NLP和机器学习的不同
- 说一下BERT和robert的不同
- 优化器
- 做题
- 动态规划,最长公共子序列
小米机器学习三面
- 介绍论文
- 你是做NLP的,那说一说什么是NLP,直白语言,能给父母讲懂那种
- 继续直白的讲解NLP的挑战是什么,怎么解决
- 动态规划和贪心的区别
- boost和bagging
- sql会不会,找出日志中点击小米产品的user_id,并按照数量从大到小排序
- 讲一下论文
- 说一下,ANN search的过程
小米机器学习四面
- 自我介绍
- 对小米这个公司的认知
- 为什么选择来小米
- 职业规划
- 对部门业务还有什么疑问
已offer
美团:
美团搜索推荐一面:
- 论文
- 阿里妈妈实习
- 项目
- 做题
- 滑动窗口经典题
挂
斗鱼
斗鱼搜索推荐一面:
- 论文
- 阿里妈妈实习
- 场景题,怎么识别斗鱼直播弹幕中的喷子
- 召回模型有哪些,怎么做的?
- 召回中有用单塔的吗
- 单塔和双塔区别
- 预估模型有了解吗
- 做题
- 投硬币,先投到正面获胜,先手方胜率是多少
斗鱼搜索推荐二面:
- 为什么来斗鱼
- 阿里妈妈实习
- deployed了吗,上线指标增幅多少
- 论文中NLP模型是什么
- 业务中很少用预训练大模型,你怎么想
- 遇到问题怎么解决
斗鱼HR面完,已offer
同花顺
同花顺NLP问财一面
- 讲一下论文的贡献
- 具体怎么做的,输入输出维度
- loss损失函数
- query理解和检索
- 没做题
同花顺NLP二面
- 介绍论文
- 论文都是一作,对nlp这个领域的应用见解
- 做题
- 动态规划
- 判重
HR面完已offer
星星充电
星充一面
- 介绍论文
- 机器学习
- 场景题,预测每个充电站的充电枪均时长
- 场景题,预测优惠券发放多少,利益更高
- 场景题,预测每个场站的电价,收益更高
- boost和bagging
- 做题
- 合并k个有序的长度为n的链表,时间复杂度nlogk
星充二面
- 介绍论文
- 实习上线怎么做的
- 工程能力
- 代码题
- 反转二叉树的单层节点
星充三面
- 介绍论文
- 介绍项目
- 挑战和创新点
- 怎么解决的
星充四面
- 本科和研究生不同是什么
- 怎么解决困难
- 周围人怎么评价你
- 你认为自己的优缺点
- 为什么想来常州
- 你的职业规划
已offer