2024转型大模型面试指南:兄弟们,冲啊

前言

老宋这俩月又跳槽了,自从去年从百度出来来到新公司,躺了一年,最近因为大模型技术发展,重新有了奋斗的方向和动力。

大模型的诞生必然会重塑整个 NLP 方向,因此,必须参与到这波浪潮中,果然,这行就是得奋发向上,不然躺的时间久了真滴容易被时代抛弃。

话不多说,来聊聊这次的跳槽过程。

萌生跳槽想法

其实早在4月份左右就想跳槽,那时候其实想回大厂,但是当时题也没有刷,且在这家公司还没有呆够一年,于是迟迟没有下定决心跳槽,毕竟躺着是真舒服。

到了5月份,又发生了一些事情,整个人丧了下来,到了8月份才开始重整旗鼓,决定跳槽。当时跳槽的想法其实很简单:大模型这波浪潮必将引发生成式AI 接下来的发展,要是不懂大模型一整套东西,很容易被时代抛下。

面试过程

到了8月10号左右开始投简历,到10月初初步定了offer范围,这次战线拉的还是太长了,不过最后的结果符合我的预期。

整个的面试思路主要分为三个方向:

  • 方向1:先面试大模型应用方向,看看各个公司在应用端的思考
  • 方向2:面试大模型垂域基座方向,看看垂域的基座落地情况
  • 方向3:面试大模型基座方向,看看最顶级的基座是怎么做的

本次面试一大缺陷是,题是边面边刷的,前期很多面试都挂在题上了,后期倒是一面一个过。

第一波:8-9月

第一波主要投了一些中小厂公司,如知乎,360数科,新浪,伊对,面壁,以及阿里的几个NLP不强的部门如高德等。

第一波刚开始没有刷题,八股文也没怎么看,直接裸面,感觉很酸爽。

这一波主要还是积累面试经验,找找感觉,其中知乎和360数科很快发了offer,其余挂的原因如下:

  • 新浪:给不起钱挂了
  • 智谱:挂,题没做出来,不该这么早面的,这家水平蛮高的,值得重视。
  • 伊对:跟面试官气场不和,面试官有点傲气凌然的感觉,于是自己主动结束了面试
  • 面壁智能:题没做出来,挂了,这个不应该放在前期面,这家要求蛮高的,该好好准备的。猎头老催面试,真不能听猎头瞎说。
  • 阿里高德:三面挂,应该是我说不想做大模型在ner,分类方向的应用
  • 阿里优酷:题没做出来。
  • 天眼查:二面主动结束面试了。
  • 阿里 LAZADA:说不想做大模型在ner,分类的应用。
  • 作业帮:题没做出来。
  • 百度-语音语义一体化:跟大模型没关系,一面主动结束面试。
  • 百度电商:新部门,感觉风险大,二面主动结束面试。
  • 高途:二面主动结束面试

面了十多天,基本上俩offer,360数科和知乎,阿里一个没过也是出乎意料,打击了我的自信。跟知乎和360数科仔细聊了聊工作内容,果断拒掉了。

第二波:9-10月

此时,我注意到了刷题的重要性,开始迅速补齐短板,大概刷了200+道左右。接下来主要面了几家公司:

  • 阿里-夸克:挂,面了两次,题都出的忒偏了,出几何题,不知道是故意难为我还是就是这种风格,无缘。
  • 阿里淘天:三面主动结束面试,说是只有知识图谱方向了,我不想去。
  • 美团外卖:三面主动结束面试,非大模型基座方向。
  • 好未来:offer,大模型垂类基座,好未来有很强的转型需求,我蛮看好在教育场景落地的,没双减我就去了。
  • 字节-剪映:一面主动结束面试,去了做搜推,不太感兴趣。字节加班太多,因此我主要是以感受为主。
  • 中科创达:二面主动结束面试,车上的大模型,感觉风险有点大。
  • 金山云:offer。
  • 美团-语音交互部:二面主动结束面试。我有兄弟在里面,其实挺想去的,但是纠结了很久还是想做 50B 以上的model。
  • baichuan:一面主动结束面试,这家其实我很想去,因为我蛮看好的。但是跟面试官聊,面试官很着急,也不知道为啥,问的深度也不深,总是浅尝截止,还judge了我,我不太喜欢这种面试,就主动结束了。
  • 百度-文心一言 ernie 组:offer,本来非常想去。

拿完百度文心后,我就开始躺了,毕竟在我心中,百度文心是国内最顶级团队。但是跟经理聊了聊,发现做的方向不确定性很大,并且加班强度非常大,忍痛拒绝了。后面有其他非常好的团队约面我都拒绝了,面不动了。

总的来看,这次面试通过率前期比较低,主要还是挂在题上,后期基本都能过,主要是题刷够了。

还有一些非常牛逼的团队拒了我简历,因为我躺了一年,简历还是有所影响的,比如腾讯混元。

这次面试也有几个筛选标准,比如说太卷的不去如字节,太小的不去,钱少的不去等。

到此,面试就初步告一段落了,实在是面不动了,最后还是选了相对work-banlance的一家。

为啥不开卷?

这里有必要聊一聊我为啥不开卷。

首先就是奋斗的意义问题,众所周知,我国的税很高,五险也是税,那么涨工资的意义在哪呢?你累死累活都交税了,卷个屁啊。

其次就是生活问题,人这一辈子就活这么一次,总不能你回首往事时,发现自己的人生一大半都在学习和加班吧?

最后就是身体,懂得都懂。

本次面试教训总结

  • 要先刷够300道再面,不能直接裸面
  • 八股文先总结一遍,做到非常熟悉
  • 练手三家即可,圈定好核心面试的公司,别面太多家,太累了
  • 别去不知名的小厂,不然影响简历太严重

面试常见题

接下来我来讲讲面试中经常遇到的题,以及这些题的简单回答,主要包括:

  • 文本生成的重复问题
  • 介绍下 ChatGLM
  • 介绍下baichuan
  • 介绍下 CRF
  • 介绍下Deepspeed的zero
  • 介绍下 Adam的原理和思想
  • FP16,BP16区别
  • 介绍下 GLU 和 SwiGLU
  • 介绍下 Lora
  • 介绍下 Lamma 系列
  • 介绍下 Transformer
  • 介绍下 BART,以及 BART与T5的区别
  • BN 和 LN
  • 介绍下交叉熵
  • 几个位置编码的区别
  • 详细介绍下旋转位置编码
  • 简单介绍下分词方式
  • 用torch 实现欧氏距离
  • 三大并行方式
  • 大小王概率题

最后

我认为 AI 再次进入了快速迭代期,躺了一年多,这次出来打算好好拼一把,看看这两年能不能搏一搏,单车变摩托。

如果兄弟们还在搞传统 NLP,我的建议是赶紧转大模型方向,无论是应用还是基座。诸位加油。

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值