【面试经验】滴滴提前批 - 大模型算法工程师(12345面)

一面/技术面 2024/7/30 下午14:00-14:30
面试官先介绍了一下部门的整体情况
自我介绍
快手实习,详细问了XGBoost
损失函数?
如何处理缺失值?
bagging和boosting模型异同
如何处理样本不均衡的问题
腾讯实习
介绍LongLoRA
长文本有哪些技术
norm有哪些作用
为什么不能用bn
OOM一般你怎么解决
说说deepspeed
反问:业务场景
Coding:岛屿数量

二面/技术面 2024/8/7 晚上19:00-19:40
自我介绍
介绍腾讯实习
目前上线后有没有遇到什么问题,后续打算如何解决
遇到的最难的问题是什么,如何解决的
模型并行和数据并行
模型的哪些部分比较耗费显存
说说DeepSpeed
了解RLHF么
SFT过程中哪些因素比较重要
完全微调在什么情况下会比LoRA微调好
大模型前向传播和反向传播会有哪些过程
哪些因素会影响显存占用
如果调大batch_size会对哪些部分有影响
在sft的过程中,有没有哪些参数比较重要,有没有较好的经验值

三面/技术面 2024/8/13 早上8:00-9:00
自我介绍
腾讯实习
负责了哪些部分
你进去实习之前组内的大模型是怎么处理的
效果如何测评
数据集构建过程
从最开始调研到模型上线的全流程
有没有遇到比较难解决的问题,如何解决的
上线后使用有没有什么bad case,如何解决的
开放性问题:用大模型做智能客服,从头到尾设计一下
假设有大量的历史交互数据,以及知识库,你会怎么去优化,从长文本和RAG两个角度说了一下
大量历史数据微调后效果很一般,该如何去优化
个人往后想做的方向有什么倾向,做落地(论文这么多,为什么不做研究?我觉得比我论文多的人很多)
日常通过什么途径和渠道来了解前言技术进展
反问
一天后收到了四面通知,以为是HR面,点进去之后发现是新锐加面

四面/新锐加面/技术面 2024/8/14 下午14:00-15:00
自我介绍
介绍腾讯实习
长文本如何测评
了解哪些长文本技术
为啥没用腾讯内部的混元
应用场景下一般会提问哪些问题
数据集构造
上线后出现了哪些bad case,如何解决的
你负责了哪些部分
哪些部分比较难
聊了聊华为910B
显卡利用率低和哪些因素有关
开放问题:摒弃你现在做的东西,设计一套RAG系统来做长文本的摘要理解,给了一定的思考时间
长文本能打败极致的RAG吗
RAG在摘要理解方面的能力如何提升
详细介绍了NIPS论文
聊了聊实验室方向
聊了聊面试的其他岗位,滴滴排序在哪个位置
回去等通知

五面/HR面 2024/8/19 下午17:30-18:00
HR自我介绍
自我介绍
面试轮次较多,对前边几轮面试以及面试官有没有什么看法,觉得怎么样
对滴滴的印象以及建议
硕士阶段是如何一步步走到现在的,目标,如何去做
怎么想到走算法岗这条路的
觉得自己相比腾讯这边其他实习生,优势在哪里,劣势在哪里
问了腾讯这边转正的事
还面试了哪些公司
未来对工作有哪些要求
未来的工作更倾向于做什么方向
反问:预计八月底发offer意向,谈薪十月份
总体来讲滴滴没怎么考察代码,主要是深挖实习细节,以及各种场景题,比较开放

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

litterfinger

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值