节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。
针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。
汇总合集:《大模型面试宝典》(2024版) 发布!
最近一位星球成员面试理想汽车大模型算法岗,被疯狂拷打的经历。
今天我把他的面经题整理总结一下,希望可以对大家找工作有帮助,喜欢点赞、收藏、关注。
一面挺难
自我介绍,讲一下大模型应用项目(我讲的nl2sql的项目)
项目背景,总体思路,解决什么问题,指标是什么,
细节拆分:
-
数据集怎么构建的,什么规模,有没有质量评估
-
模型底座是什么,这些不同底座什么区别,什么规模
-
训练方法,用的什么s,有什么不同,有什么优缺点,原理上解释不不同方法,的差别
-
评估指标是什么,这些指标存在哪些问题,
-
模型推理是怎么做的,有没有cot,tot等等,还是单轮
-
模型可控性如何实现,怎么保证可控性
-
模型部署的平台,推理效率怎么样,如何提升推理效率
-
有没有上线,面临什么问题,怎么解决
-
给一个总的输入输出样例,每一步包含什么prompt,多轮推理每一步输出什么,结果,模拟一下,数据集格式是否要调整成这样,数据形式是什么,怎么拆分成,多轮形式等等。
到这里项目差不多了大概问了45min
然后是八股+开放式问题,
-
大模型前景
-
大模型主要存在的问题和解决思路(幻觉,定向编辑,继续训练等等)
-
大模型加速框架了解多少,知不知道原理如何进行加速优化
-
为什么要用大模型做传统结构化解析任务你对用大模型做这些事有什么看法
到这差不多1小时
最后是能不能实习,对最新的研究了解多少,看过多少最新论文等等
我本以为结束了,但是,最后我们来做一道题吧,一个迭代法求根的题,反正当时已经神志不清了,好像没ac
二面45min
很简单,感觉是部门leader,简单问了问项目,普通八股,大模型上线会有什么,问题,占用多少资源,怎么优化等等,比一面简单太多
技术交流群
前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~
我们建了算法岗技术与面试交流群, 想要获取最新面试题、了解最新面试动态的、需要源码&资料、提升技术的同学,可以直接加微信号:mlc2040。加的时候备注一下:研究方向 +学校/公司+CSDN,即可。然后就可以拉你进群了。
方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:技术交流