2024转型大模型面试指南：兄弟们，冲啊

七七Seven～

于 2024-07-15 10:27:19 发布

阅读量363

点赞数 6

文章标签：面试职场和发展服务器 langchain 人工智能运维 javascript

本文链接：https://blog.csdn.net/2401_84205765/article/details/140431586

版权

前言

老宋这俩月又跳槽了，自从去年从百度出来来到新公司，躺了一年，最近因为大模型技术发展，重新有了奋斗的方向和动力。

大模型的诞生必然会重塑整个 NLP 方向，因此，必须参与到这波浪潮中，果然，这行就是得奋发向上，不然躺的时间久了真滴容易被时代抛弃。

话不多说，来聊聊这次的跳槽过程。

萌生跳槽想法

其实早在4月份左右就想跳槽，那时候其实想回大厂，但是当时题也没有刷，且在这家公司还没有呆够一年，于是迟迟没有下定决心跳槽，毕竟躺着是真舒服。

到了5月份，又发生了一些事情，整个人丧了下来，到了8月份才开始重整旗鼓，决定跳槽。当时跳槽的想法其实很简单：大模型这波浪潮必将引发生成式AI 接下来的发展，要是不懂大模型一整套东西，很容易被时代抛下。

面试过程

到了8月10号左右开始投简历，到10月初初步定了offer范围，这次战线拉的还是太长了，不过最后的结果符合我的预期。

整个的面试思路主要分为三个方向：

方向1：先面试大模型应用方向，看看各个公司在应用端的思考
方向2：面试大模型垂域基座方向，看看垂域的基座落地情况
方向3：面试大模型基座方向，看看最顶级的基座是怎么做的

本次面试一大缺陷是，题是边面边刷的，前期很多面试都挂在题上了，后期倒是一面一个过。

第一波：8-9月

第一波主要投了一些中小厂公司，如知乎，360数科，新浪，伊对，面壁，以及阿里的几个NLP不强的部门如高德等。

第一波刚开始没有刷题，八股文也没怎么看，直接裸面，感觉很酸爽。

这一波主要还是积累面试经验，找找感觉，其中知乎和360数科很快发了offer，其余挂的原因如下：

新浪：给不起钱挂了
智谱：挂，题没做出来，不该这么早面的，这家水平蛮高的，值得重视。
伊对：跟面试官气场不和，面试官有点傲气凌然的感觉，于是自己主动结束了面试
面壁智能：题没做出来，挂了，这个不应该放在前期面，这家要求蛮高的，该好好准备的。猎头老催面试，真不能听猎头瞎说。
阿里高德：三面挂，应该是我说不想做大模型在ner，分类方向的应用
阿里优酷：题没做出来。
天眼查：二面主动结束面试了。
阿里 LAZADA：说不想做大模型在ner，分类的应用。
作业帮：题没做出来。
百度-语音语义一体化：跟大模型没关系，一面主动结束面试。
百度电商：新部门，感觉风险大，二面主动结束面试。
高途：二面主动结束面试

面了十多天，基本上俩offer，360数科和知乎，阿里一个没过也是出乎意料，打击了我的自信。跟知乎和360数科仔细聊了聊工作内容，果断拒掉了。

第二波：9-10月

此时，我注意到了刷题的重要性，开始迅速补齐短板，大概刷了200+道左右。接下来主要面了几家公司：

阿里-夸克：挂，面了两次，题都出的忒偏了，出几何题，不知道是故意难为我还是就是这种风格，无缘。
阿里淘天：三面主动结束面试，说是只有知识图谱方向了，我不想去。
美团外卖：三面主动结束面试，非大模型基座方向。
好未来：offer，大模型垂类基座，好未来有很强的转型需求，我蛮看好在教育场景落地的，没双减我就去了。
字节-剪映：一面主动结束面试，去了做搜推，不太感兴趣。字节加班太多，因此我主要是以感受为主。
中科创达：二面主动结束面试，车上的大模型，感觉风险有点大。
金山云：offer。
美团-语音交互部：二面主动结束面试。我有兄弟在里面，其实挺想去的，但是纠结了很久还是想做 50B 以上的model。
baichuan：一面主动结束面试，这家其实我很想去，因为我蛮看好的。但是跟面试官聊，面试官很着急，也不知道为啥，问的深度也不深，总是浅尝截止，还judge了我，我不太喜欢这种面试，就主动结束了。
百度-文心一言 ernie 组：offer，本来非常想去。

拿完百度文心后，我就开始躺了，毕竟在我心中，百度文心是国内最顶级团队。但是跟经理聊了聊，发现做的方向不确定性很大，并且加班强度非常大，忍痛拒绝了。后面有其他非常好的团队约面我都拒绝了，面不动了。

总的来看，这次面试通过率前期比较低，主要还是挂在题上，后期基本都能过，主要是题刷够了。

还有一些非常牛逼的团队拒了我简历，因为我躺了一年，简历还是有所影响的，比如腾讯混元。

这次面试也有几个筛选标准，比如说太卷的不去如字节，太小的不去，钱少的不去等。

到此，面试就初步告一段落了，实在是面不动了，最后还是选了相对work-banlance的一家。

为啥不开卷？

这里有必要聊一聊我为啥不开卷。

首先就是奋斗的意义问题，众所周知，我国的税很高，五险也是税，那么涨工资的意义在哪呢？你累死累活都交税了，卷个屁啊。

其次就是生活问题，人这一辈子就活这么一次，总不能你回首往事时，发现自己的人生一大半都在学习和加班吧？

最后就是身体，懂得都懂。

本次面试教训总结

要先刷够300道再面，不能直接裸面
八股文先总结一遍，做到非常熟悉
练手三家即可，圈定好核心面试的公司，别面太多家，太累了
别去不知名的小厂，不然影响简历太严重

面试常见题

接下来我来讲讲面试中经常遇到的题，以及这些题的简单回答，主要包括：

文本生成的重复问题
介绍下 ChatGLM
介绍下baichuan
介绍下 CRF
介绍下Deepspeed的zero
介绍下 Adam的原理和思想
FP16，BP16区别
介绍下 GLU 和 SwiGLU
介绍下 Lora
介绍下 Lamma 系列
介绍下 Transformer
介绍下 BART，以及 BART与T5的区别
BN 和 LN
介绍下交叉熵
几个位置编码的区别
详细介绍下旋转位置编码
简单介绍下分词方式
用torch 实现欧氏距离
三大并行方式
大小王概率题

最后

我认为 AI 再次进入了快速迭代期，躺了一年多，这次出来打算好好拼一把，看看这两年能不能搏一搏，单车变摩托。

如果兄弟们还在搞传统 NLP，我的建议是赶紧转大模型方向，无论是应用还是基座。诸位加油。

一、大模型全套的学习路线

学习大型人工智能模型，如GPT-3、BERT或任何其他先进的神经网络模型，需要系统的方法和持续的努力。既然要系统的学习大模型，那么学习路线是必不可少的，下面的这份路线能帮助你快速梳理知识，形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别：AI大模型API应用开发工程

L3级别：大模型应用架构进阶实践

L4级别：大模型微调与私有化部署

一般掌握到第四个级别，市场上大多数岗位都是可以胜任，但要还不是天花板，天花板级别要求更加严格，对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线，不知道为什么发出来就有点糊，高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

七七Seven～

关注

6
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
2024转型大模型面试指南：兄弟们，冲啊

老宋这俩月又跳槽了，自从去年从百度出来来到新公司，躺了一年，最近因为大模型技术发展，重新有了奋斗的方向和动力。大模型的诞生必然会重塑整个 NLP 方向，因此，必须参与到这波浪潮中，果然，这行就是得奋发向上，不然躺的时间久了真滴容易被时代抛弃。话不多说，来聊聊这次的跳槽过程。
复制链接

扫一扫