【面试经验】滴滴提前批 - 大模型算法工程师（12345面）

最新推荐文章于 2024-10-05 10:23:36 发布

litterfinger

最新推荐文章于 2024-10-05 10:23:36 发布

阅读量336

点赞数 7

文章标签：面试职场和发展

本文链接：https://blog.csdn.net/litterfinger/article/details/141990831

版权

一面/技术面 2024/7/30 下午14:00-14:30
面试官先介绍了一下部门的整体情况
自我介绍
快手实习，详细问了XGBoost
损失函数？
如何处理缺失值？
bagging和boosting模型异同
如何处理样本不均衡的问题
腾讯实习
介绍LongLoRA
长文本有哪些技术
norm有哪些作用
为什么不能用bn
OOM一般你怎么解决
说说deepspeed
反问：业务场景
Coding：岛屿数量

二面/技术面 2024/8/7 晚上19:00-19:40
自我介绍
介绍腾讯实习
目前上线后有没有遇到什么问题，后续打算如何解决
遇到的最难的问题是什么，如何解决的
模型并行和数据并行
模型的哪些部分比较耗费显存
说说DeepSpeed
了解RLHF么
SFT过程中哪些因素比较重要
完全微调在什么情况下会比LoRA微调好
大模型前向传播和反向传播会有哪些过程
哪些因素会影响显存占用
如果调大batch_size会对哪些部分有影响
在sft的过程中，有没有哪些参数比较重要，有没有较好的经验值

三面/技术面 2024/8/13 早上8:00-9:00
自我介绍
腾讯实习
负责了哪些部分
你进去实习之前组内的大模型是怎么处理的
效果如何测评
数据集构建过程
从最开始调研到模型上线的全流程
有没有遇到比较难解决的问题，如何解决的
上线后使用有没有什么bad case，如何解决的
开放性问题：用大模型做智能客服，从头到尾设计一下
假设有大量的历史交互数据，以及知识库，你会怎么去优化，从长文本和RAG两个角度说了一下
大量历史数据微调后效果很一般，该如何去优化
个人往后想做的方向有什么倾向，做落地（论文这么多，为什么不做研究？我觉得比我论文多的人很多）
日常通过什么途径和渠道来了解前言技术进展
反问
一天后收到了四面通知，以为是HR面，点进去之后发现是新锐加面

四面/新锐加面/技术面 2024/8/14 下午14:00-15:00
自我介绍
介绍腾讯实习
长文本如何测评
了解哪些长文本技术
为啥没用腾讯内部的混元
应用场景下一般会提问哪些问题
数据集构造
上线后出现了哪些bad case，如何解决的
你负责了哪些部分
哪些部分比较难
聊了聊华为910B
显卡利用率低和哪些因素有关
开放问题：摒弃你现在做的东西，设计一套RAG系统来做长文本的摘要理解，给了一定的思考时间
长文本能打败极致的RAG吗
RAG在摘要理解方面的能力如何提升
详细介绍了NIPS论文
聊了聊实验室方向
聊了聊面试的其他岗位，滴滴排序在哪个位置
回去等通知

五面/HR面 2024/8/19 下午17:30-18:00
HR自我介绍
自我介绍
面试轮次较多，对前边几轮面试以及面试官有没有什么看法，觉得怎么样
对滴滴的印象以及建议
硕士阶段是如何一步步走到现在的，目标，如何去做
怎么想到走算法岗这条路的
觉得自己相比腾讯这边其他实习生，优势在哪里，劣势在哪里
问了腾讯这边转正的事
还面试了哪些公司
未来对工作有哪些要求
未来的工作更倾向于做什么方向
反问：预计八月底发offer意向，谈薪十月份
总体来讲滴滴没怎么考察代码，主要是深挖实习细节，以及各种场景题，比较开放