前言
老宋这俩月又跳槽了,自从去年从百度出来来到新公司,躺了一年,最近因为大模型技术发展,重新有了奋斗的方向和动力。
大模型的诞生必然会重塑整个 NLP 方向,因此,必须参与到这波浪潮中,果然,这行就是得奋发向上,不然躺的时间久了真滴容易被时代抛弃。
话不多说,来聊聊这次的跳槽过程。
萌生跳槽想法
其实早在4月份左右就想跳槽,那时候其实想回大厂,但是当时题也没有刷,且在这家公司还没有呆够一年,于是迟迟没有下定决心跳槽,毕竟躺着是真舒服。
到了5月份,又发生了一些事情,整个人丧了下来,到了8月份才开始重整旗鼓,决定跳槽。当时跳槽的想法其实很简单:大模型这波浪潮必将引发生成式AI 接下来的发展,要是不懂大模型一整套东西,很容易被时代抛下。
面试过程
到了8月10号左右开始投简历,到10月初初步定了offer范围,这次战线拉的还是太长了,不过最后的结果符合我的预期。
整个的面试思路主要分为三个方向:
- 方向1:先面试大模型应用方向,看看各个公司在应用端的思考
- 方向2:面试大模型垂域基座方向,看看垂域的基座落地情况
- 方向3:面试大模型基座方向,看看最顶级的基座是怎么做的
本次面试一大缺陷是,题是边面边刷的,前期很多面试都挂在题上了,后期倒是一面一个过。
第一波:8-9月
第一波主要投了一些中小厂公司,如知乎,360数科,新浪,伊对,面壁,以及阿里的几个NLP不强的部门如高德等。
第一波刚开始没有刷题,八股文也没怎么看,直接裸面,感觉很酸爽。
这一波主要还是积累面试经验,找找感觉,其中知乎和360数科很快发了offer,其余挂的原因如下:
- 新浪:给不起钱挂了
- 智谱:挂,题没做出来,不该这么早面的,这家水平蛮高的,值得重视。
- 伊对:跟面试官气场不和,面试官有点傲气凌然的感觉,于是自己主动结束了面试
- 面壁智能:题没做出来,挂了,这个不应该放在前期面,这家要求蛮高的,该好好准备的。猎头老催面试,真不能听猎头瞎说。
- 阿里高德:三面挂,应该是我说不想做大模型在ner,分类方向的应用
- 阿里优酷:题没做出来。
- 天眼查:二面主动结束面试了。
- 阿里 LAZADA:说不想做大模型在ner,分类的应用。
- 作业帮:题没做出来。
- 百度-语音语义一体化:跟大模型没关系,一面主动结束面试。
- 百度电商:新部门,感觉风险大,二面主动结束面试。
- 高途:二面主动结束面试
面了十多天,基本上俩offer,360数科和知乎,阿里一个没过也是出乎意料,打击了我的自信。跟知乎和360数科仔细聊了聊工作内容,果断拒掉了。
第二波:9-10月
此时,我注意到了刷题的重要性,开始迅速补齐短板,大概刷了200+道左右。接下来主要面了几家公司:
- 阿里-夸克:挂,面了两次,题都出的忒偏了,出几何题,不知道是故意难为我还是就是这种风格,无缘。
- 阿里淘天:三面主动结束面试,说是只有知识图谱方向了,我不想去。
- 美团外卖:三面主动结束面试,非大模型基座方向。
- 好未来:offer,大模型垂类基座,好未来有很强的转型需求,我蛮看好在教育场景落地的,没双减我就去了。
- 字节-剪映:一面主动结束面试,去了做搜推,不太感兴趣。字节加班太多,因此我主要是以感受为主。
- 中科创达:二面主动结束面试,车上的大模型,感觉风险有点大。
- 金山云:offer。
- 美团-语音交互部:二面主动结束面试。我有兄弟在里面,其实挺想去的,但是纠结了很久还是想做 50B 以上的model。
- baichuan:一面主动结束面试,这家其实我很想去,因为我蛮看好的。但是跟面试官聊,面试官很着急,也不知道为啥,问的深度也不深,总是浅尝截止,还judge了我,我不太喜欢这种面试,就主动结束了。
- 百度-文心一言 ernie 组:offer,本来非常想去。
拿完百度文心后,我就开始躺了,毕竟在我心中,百度文心是国内最顶级团队。但是跟经理聊了聊,发现做的方向不确定性很大,并且加班强度非常大,忍痛拒绝了。后面有其他非常好的团队约面我都拒绝了,面不动了。
总的来看,这次面试通过率前期比较低,主要还是挂在题上,后期基本都能过,主要是题刷够了。
还有一些非常牛逼的团队拒了我简历,因为我躺了一年,简历还是有所影响的,比如腾讯混元。
这次面试也有几个筛选标准,比如说太卷的不去如字节,太小的不去,钱少的不去等。
到此,面试就初步告一段落了,实在是面不动了,最后还是选了相对work-banlance的一家。
为啥不开卷?
这里有必要聊一聊我为啥不开卷。
首先就是奋斗的意义问题,众所周知,我国的税很高,五险也是税,那么涨工资的意义在哪呢?你累死累活都交税了,卷个屁啊。
其次就是生活问题,人这一辈子就活这么一次,总不能你回首往事时,发现自己的人生一大半都在学习和加班吧?
最后就是身体,懂得都懂。
本次面试教训总结
- 要先刷够300道再面,不能直接裸面
- 八股文先总结一遍,做到非常熟悉
- 练手三家即可,圈定好核心面试的公司,别面太多家,太累了
- 别去不知名的小厂,不然影响简历太严重
面试常见题
接下来我来讲讲面试中经常遇到的题,以及这些题的简单回答,主要包括:
- 文本生成的重复问题
- 介绍下 ChatGLM
- 介绍下baichuan
- 介绍下 CRF
- 介绍下Deepspeed的zero
- 介绍下 Adam的原理和思想
- FP16,BP16区别
- 介绍下 GLU 和 SwiGLU
- 介绍下 Lora
- 介绍下 Lamma 系列
- 介绍下 Transformer
- 介绍下 BART,以及 BART与T5的区别
- BN 和 LN
- 介绍下交叉熵
- 几个位置编码的区别
- 详细介绍下旋转位置编码
- 简单介绍下分词方式
- 用torch 实现欧氏距离
- 三大并行方式
- 大小王概率题
最后
我认为 AI 再次进入了快速迭代期,躺了一年多,这次出来打算好好拼一把,看看这两年能不能搏一搏,单车变摩托。
如果兄弟们还在搞传统 NLP,我的建议是赶紧转大模型方向,无论是应用还是基座。诸位加油。
一、大模型全套的学习路线
学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。
L1级别:AI大模型时代的华丽登场
L2级别:AI大模型API应用开发工程
L3级别:大模型应用架构进阶实践
L4级别:大模型微调与私有化部署
一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。
以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
三、大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
四、AI大模型商业化落地方案
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。