2024转型大模型面试指南:兄弟们,冲啊

前言

老宋这俩月又跳槽了,自从去年从百度出来来到新公司,躺了一年,最近因为大模型技术发展,重新有了奋斗的方向和动力。

大模型的诞生必然会重塑整个 NLP 方向,因此,必须参与到这波浪潮中,果然,这行就是得奋发向上,不然躺的时间久了真滴容易被时代抛弃。

话不多说,来聊聊这次的跳槽过程。

萌生跳槽想法

其实早在4月份左右就想跳槽,那时候其实想回大厂,但是当时题也没有刷,且在这家公司还没有呆够一年,于是迟迟没有下定决心跳槽,毕竟躺着是真舒服。

到了5月份,又发生了一些事情,整个人丧了下来,到了8月份才开始重整旗鼓,决定跳槽。当时跳槽的想法其实很简单:大模型这波浪潮必将引发生成式AI 接下来的发展,要是不懂大模型一整套东西,很容易被时代抛下。

面试过程

到了8月10号左右开始投简历,到10月初初步定了offer范围,这次战线拉的还是太长了,不过最后的结果符合我的预期。

整个的面试思路主要分为三个方向:

  • 方向1:先面试大模型应用方向,看看各个公司在应用端的思考
  • 方向2:面试大模型垂域基座方向,看看垂域的基座落地情况
  • 方向3:面试大模型基座方向,看看最顶级的基座是怎么做的

本次面试一大缺陷是,题是边面边刷的,前期很多面试都挂在题上了,后期倒是一面一个过。

第一波:8-9月

第一波主要投了一些中小厂公司,如知乎,360数科,新浪,伊对,面壁,以及阿里的几个NLP不强的部门如高德等。

第一波刚开始没有刷题,八股文也没怎么看,直接裸面,感觉很酸爽。

这一波主要还是积累面试经验,找找感觉,其中知乎和360数科很快发了offer,其余挂的原因如下:

  • 新浪:给不起钱挂了
  • 智谱:挂,题没做出来,不该这么早面的,这家水平蛮高的,值得重视。
  • 伊对:跟面试官气场不和,面试官有点傲气凌然的感觉,于是自己主动结束了面试
  • 面壁智能:题没做出来,挂了,这个不应该放在前期面,这家要求蛮高的,该好好准备的。猎头老催面试,真不能听猎头瞎说。
  • 阿里高德:三面挂,应该是我说不想做大模型在ner,分类方向的应用
  • 阿里优酷:题没做出来。
  • 天眼查:二面主动结束面试了。
  • 阿里 LAZADA:说不想做大模型在ner,分类的应用。
  • 作业帮:题没做出来。
  • 百度-语音语义一体化:跟大模型没关系,一面主动结束面试。
  • 百度电商:新部门,感觉风险大,二面主动结束面试。
  • 高途:二面主动结束面试

面了十多天,基本上俩offer,360数科和知乎,阿里一个没过也是出乎意料,打击了我的自信。跟知乎和360数科仔细聊了聊工作内容,果断拒掉了。

第二波:9-10月

此时,我注意到了刷题的重要性,开始迅速补齐短板,大概刷了200+道左右。接下来主要面了几家公司:

  • 阿里-夸克:挂,面了两次,题都出的忒偏了,出几何题,不知道是故意难为我还是就是这种风格,无缘。
  • 阿里淘天:三面主动结束面试,说是只有知识图谱方向了,我不想去。
  • 美团外卖:三面主动结束面试,非大模型基座方向。
  • 好未来:offer,大模型垂类基座,好未来有很强的转型需求,我蛮看好在教育场景落地的,没双减我就去了。
  • 字节-剪映:一面主动结束面试,去了做搜推,不太感兴趣。字节加班太多,因此我主要是以感受为主。
  • 中科创达:二面主动结束面试,车上的大模型,感觉风险有点大。
  • 金山云:offer。
  • 美团-语音交互部:二面主动结束面试。我有兄弟在里面,其实挺想去的,但是纠结了很久还是想做 50B 以上的model。
  • baichuan:一面主动结束面试,这家其实我很想去,因为我蛮看好的。但是跟面试官聊,面试官很着急,也不知道为啥,问的深度也不深,总是浅尝截止,还judge了我,我不太喜欢这种面试,就主动结束了。
  • 百度-文心一言 ernie 组:offer,本来非常想去。

拿完百度文心后,我就开始躺了,毕竟在我心中,百度文心是国内最顶级团队。但是跟经理聊了聊,发现做的方向不确定性很大,并且加班强度非常大,忍痛拒绝了。后面有其他非常好的团队约面我都拒绝了,面不动了。

总的来看,这次面试通过率前期比较低,主要还是挂在题上,后期基本都能过,主要是题刷够了。

还有一些非常牛逼的团队拒了我简历,因为我躺了一年,简历还是有所影响的,比如腾讯混元。

这次面试也有几个筛选标准,比如说太卷的不去如字节,太小的不去,钱少的不去等。

到此,面试就初步告一段落了,实在是面不动了,最后还是选了相对work-banlance的一家。

为啥不开卷?

这里有必要聊一聊我为啥不开卷。

首先就是奋斗的意义问题,众所周知,我国的税很高,五险也是税,那么涨工资的意义在哪呢?你累死累活都交税了,卷个屁啊。

其次就是生活问题,人这一辈子就活这么一次,总不能你回首往事时,发现自己的人生一大半都在学习和加班吧?

最后就是身体,懂得都懂。

本次面试教训总结

  • 要先刷够300道再面,不能直接裸面
  • 八股文先总结一遍,做到非常熟悉
  • 练手三家即可,圈定好核心面试的公司,别面太多家,太累了
  • 别去不知名的小厂,不然影响简历太严重

面试常见题

接下来我来讲讲面试中经常遇到的题,以及这些题的简单回答,主要包括:

  • 文本生成的重复问题
  • 介绍下 ChatGLM
  • 介绍下baichuan
  • 介绍下 CRF
  • 介绍下Deepspeed的zero
  • 介绍下 Adam的原理和思想
  • FP16,BP16区别
  • 介绍下 GLU 和 SwiGLU
  • 介绍下 Lora
  • 介绍下 Lamma 系列
  • 介绍下 Transformer
  • 介绍下 BART,以及 BART与T5的区别
  • BN 和 LN
  • 介绍下交叉熵
  • 几个位置编码的区别
  • 详细介绍下旋转位置编码
  • 简单介绍下分词方式
  • 用torch 实现欧氏距离
  • 三大并行方式
  • 大小王概率题

最后

我认为 AI 再次进入了快速迭代期,躺了一年多,这次出来打算好好拼一把,看看这两年能不能搏一搏,单车变摩托。

如果兄弟们还在搞传统 NLP,我的建议是赶紧转大模型方向,无论是应用还是基座。诸位加油。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
  • 11
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值