大模型新人必看经验,刷到少走数月弯路!

前言

在这篇文章中,我将结合自身在大模型领域的丰富经验,为大家深入剖析新人应如何成功转行大模型赛道。具体内容包括大模型有哪些方向、各方向的能力要求与岗位匹配、新手转行常踩的坑和常见误区,以及入行大模型最为顺滑的路径。如果你是正打算踏入大模型领域的校招或社招同学,那么请务必认真读完,它或许能让你在转行大模型的道路上少走许多弯路。

一、大模型的方向分类

倘若你在求职网站上搜索“大模型”关键词,仔细查看招聘 JD,便能大致了解当前业内对大模型工程师的需求方向和能力要求。总结而言,可以分为以下四类:

  1. 做数据的:大模型数据工程师,主要负责爬虫、清洗、ETL、Data Engine、Pipeline 等工作。
  2. 做平台的:大模型平台工程师,从事分布式训练、大模型集群、工程基建等方面的工作。
  3. 做应用的:大模型算法工程师,涉及搜、广、推、对话机器人、AIGC 等领域。
  4. 做部署的:大模型部署工程师,负责推理加速、跨平台、端智能、嵌入式等工作。
    在这里插入图片描述

二、新手的常见误区

看到这几个方向,你会如何选择呢?估计很多人会毫不犹豫地直奔第三点,坚定地认为要做应用,走在所有工种的最前沿,创造出能让老板和用户都看得见的核心“产品”。然而,在这里我不得不给各位泼一盆冷水。在 AI 算法这个行业,第三类方向非常依赖业务经验。如果你之前本身就是从事算法工作的,比如做 NLP,或者是做语音助手、对话机器人这类的,再顺势而为去做相关方向的大模型算法工程师,这是比较合适的。在自身业务中融入一些大模型的算法和技法,取得实际的业务产出,这样在市场上也比较容易找到这类岗位。但如果你是 CS 方向的实习生、应届毕业生,或者是其他 IT 方向转行大模型,那么第三类未必是最佳选择。大家不要陷入一个误区:认为大模型算法工程师就是调模型、调超参、做预训练、做 finetune、SFT 之类的工作。实际上,这部分工作只有极少数人在做,基本一个团队中只有个位数的人从事,或者只是算法工作的很小一部分。需要注意的是,新人进去后,90%以上都不可能直接让你从事算法模型调优的工作,大部分可能会让你配置环境、搭建链路、清洗数据、分析数据、进行调研、编写 function 和 tools。只有在这些体力活都干熟练了以后,才可能会让你进行一些模型实验。其中表现出色、头脑灵活的同学,才会逐渐开始接触线上业务。还有很多同学,干了好几年,仍然在做一些边角料、脏活、杂活,根本接触不到核心业务。对于刚入行的新人来说,如果你的学历背景较好,可以去大公司做 intern 然后转正;背景稍差一些的,可以去中小公司积累业务经验。

三、数据的重要性

很多人可能往往忽视了上述的第一、二、四类方向,觉得自己学了这么多算法知识,学了机器学习、深度学习,还了解大模型,再去做数据,有点大材小用了。但我要告诉你的是,第一类方向是更多转行大模型的同学更容易上岸的方式。条条大路通罗马,并非只有一条路可走。首先,目前国外的大模型技术至少领先国内两年,虽然国内已经有几十上百个“大模型”了,但真正能打的并没有几个。究其原因,还是有很多技术没有突破。就算法本身而言,GPT 已经不是什么秘密了。那么剩下的还有什么呢?一是数据,二是工程技巧。以数据为例,先说通用的大模型训练,数据的来源在哪里,如何采集,数据的质量如何把控,怎样过滤有毒信息,语言的筛选与比例如何确定,数据的去重以及规范化处理怎么做,评测集的构建又是怎样的。这些工作既是体力活,又是技术活。对于垂直领域,比如金融、电商、法律、车企等,这种领域数据的构建就更考验技术了。业务数据从哪里来,数据不够怎么办,完全没有数据又该如何?如何构建高质量的微调数据?能把这些问题解决好,模型也就成功了一大半。因此,就目前的现状而言,对于数据工程师,特别是有经验的数据工程师,是非常稀缺的。

四、大模型平台的工作内容

接着说说第二类方向,大模型平台工程师。如果你之前是做工程的,或者对工程比较感兴趣,我比较建议你选择这个方向。大模型平台工程师和大模型基础设施建设并无本质区别,都是为了大模型业务服务,其作用是让大模型训练得更好、跑得更快。这块主要做些什么呢?从计算层面来说,有分布式计算、并行计算、高性能计算,有些公司对这三者也不加区分。从硬件层面来说,有搞大模型训练集群、GPU 集群、CPU/GPU 混部集群,要管理几百上千张卡的池子,还要负责它们的利用率、机器的健康状况,查看有没有故障的。在中小公司,这块基本都是开发和运维一体的,一个人干两个工种的活。从平台层面来说,有做 LLMOps 的,也就是 pipeline。集数据 IO、模型训练、预测、上线、监控于一体,这种就是跟着业务团队走,进行适配,打造很多高效的轮子,方便业务团队使用,减少他们额外重复开发的时间。整体上来说,在大模型时代,这个方向稳中有升。因为实际上很多公司这方面的人都是从之前搞深度学习平台、大规模机器学习平台的人招过来的,技术上的差距相对比较小。因此,对于对 AI 工程感兴趣的人来说,可以选择这个方向。

五、大模型部署的工作范畴

最后说一说第四类方向,大模型部署工程师。这个岗位之前就存在,不过在大模型这一两年尤其火热。原因何在呢?因为部署大模型太费钱了。首先,模型延迟本身就高,30B 以上的模型对算力、显存要求很高。老板关心什么呢?一方面是大模型产品,也就是业务指标要好看,方便 PR;另一方面也要求控制成本(大厂/独角兽除外)。一般企业里,一个 P8 级别的 leader,要在公司里抢业务、拉资源、找人力,本身就是一件不容易的事。“降本增效”是 2023 年以来几乎所有公司的主旋律。所以老板们很关心你节约了多少钱,比如你把推理效率提高一倍,那就实实在在降低了一倍的成本。回到大模型部署工程师这个岗位,总体有两个方向的工作:云端部署和端侧部署。云端比较好理解,可以做推理加速平台,也可以随着业务走,做大模型定制化加速,比如 Qwen-7b 的加速。还可以做大模型推理引擎,比如搜索/问答的推理引擎,一般是在高并发用户场景下,在保证用户 SLO 的前提下,最优化 latency 和 throughput。另一个大方向是端侧的部署,也就是在消费级 GPU/NPU 以及边端设备下,部署大模型,同时让领域大模型小型化,让业务能实际工程落地。总的来说,大模型部署工程师对工程能力、系统能力以及硬件等方面都要有一定的了解。现在各种推理框架出来以后,降低了一点难度,但仍然是一个比较有竞争力的工种。你得了解计算图和 OP 的优化,得了解各种推理框架、缓存/显存优化,还有 LLM 结构运行时的系统架构。这个岗位一般不推荐新人入场,因为太吃经验了。建议先从第二类方向进场,然后逐步转到第四类方向。

六、总结与建议

最后,给准备入场大模型的新人几点建议:

  1. 不要只关心 finetune、SFT、RLHF,作为系统性学习是可以的,但切忌花太多精力。
  2. 想做应用的,建议聚焦到某个垂直领域,比如对话机器人、问答系统、金融/医疗/教育方向,找一个具体的场景,把它做好、做深。
  3. 多关心数据、data pipeline、高质量训练/测试集的构建经验,对数据的敏感度是最直接,也是最适合用到未来工作当中的。
  4. 大模型不只有算法,也可以有工程。大公司拼的都是基建,平台是对业务的支撑,牛逼的 infrastructure 是大模型产品成功不可或缺的因素。

如何学习大模型技术,享受AI红利?

面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。一份系统的技术路线图,详尽的全套学习资料,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。

无论是初学者,还是希望在某一细分领域深入发展的资深开发者,这样的学习路线图都能够起到事半功倍的效果。它不仅能够节省大量时间,避免无效学习,更能帮助开发者建立系统的知识体系,为职业生涯的长远发展奠定坚实的基础。

这份完整版的AI大模型全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

在这里插入图片描述

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

面试资料

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
在这里插入图片描述

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述
这份完整版的AI大模型全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值