大模型来自面试的体会和分享 2024版

程序员笑武

于 2024-08-14 20:29:32 发布

阅读量253

点赞数 2

文章标签：面试人工智能职场和发展 llama 深度学习机器学习运维

本文链接：https://blog.csdn.net/m0_59164304/article/details/141199791

版权

大模型的赛道逐渐清晰，主要分为基座和应用两派，且两派的特点鲜明，下面我们分开讲讲。

基座赛道上，成为有钱人和巨头的游戏，主要玩家分布在明星创业公司，顶尖大厂，和不差钱的国央企。前两者不分伯仲，不过明星创业公司的人才密度相对更高一点。

基座赛道上，目前各家还保持着高涨的投入，主要原因是OpenAI给出了一个指路明灯，与第一名还存在明显差距，并且这个差距是可度量的，大家相信持续不遗余力投入，就有希望的迎头赶上。但客观情况是竞技场总榜前10想进去都十分不容易，更别提gpt4o这种明显存在技术代差的东西，基座还任重道远。

基座赛道的分工更细，有强烈的工业化大兵团作战的特点，招聘的画像也非常细分，代码，推理，数学等，恨不得一个能力标签一个负责人，再搭建各自的数据，训练，对齐团队。

基座赛道算法方向上，infra方向技术含量更高，人也更值钱，需要CS科班底子融合算法背景，门槛相对较高。但操盘训练的，主要工作精力在洗数据，配数据，训练技巧上，相对infra没太有硬性门槛，更经验驱动。infra方向，靠技术实力说话。训练和对齐方向，靠实验量和实验认知说话。

但是，训练方向的需求量更大，所以从供给分析的角度，所以相对容易找工作一点。

再说应用赛道，除了大模型本身，现在市面上还没有太成功的C端落地应用，去年比较火热的几个方向，角色扮演，characterAI创始人携团队跑路。众多电商助手，也没有做出点什么门道。反而最近的搜索产品，把大模型当成效果不错的生成模型来用，卡着多轮的能力不开放，简化技术难度，反而看着有活下来的苗头。

当然，也不是都不太行，大模型写个代码，翻译总结个文章，还是挺不错的。然后做的比较好的有，各种非助手的形态，互联网C端的比如评论区机器人，视频总结摘要，文章总结，搜索总结，从用户量维度看，算是相对成功，也能在很多APP上看到全量开放。虽然这些应用看起来都没那么炫酷，也很简单。

这些应用共有的特点有，**接近基座原生能力，场景数据丰富，或者场景数据方便构造。**在落地应用上，离原生能力越远，需要大模型能力越高，需要越多的场景优质数据。

应用方向上，目前看到的简历都有点千篇一律，xx助手，xxAgent，用了COT和function call，一个小小的垂场景，也说不出什么亮点。简历供给量很大，但有技术亮点和项目成功经验的不太多。

应用赛道往往无法向基座赛道转化，但基座赛道由于表现出良好的功底，可以向应用赛道转化。基座的赛道，人才逐渐走向小圈子化，社招互相挖人和顶尖的校招人才作为补充。

当然，基座赛道也不都是高枕无忧，常见的问题就是过于螺丝钉了，甚至有些厂，让每个人都负责一小块工作，信息单向流动，有完整认知和可泛化经验的不多，人才逐渐工具化。

再看整个大模型市场的供给情况，从去年严重供小于求，已经逐渐变成供给多，需求也多的情况，处于高水位平衡状态。去年中期，大模型市场上offer涨幅150%都有，到年底还有70%的可能，现在，正常能有30%就很不错了。

比较危险的是需求开始收缩的那一刻**，高水位的平衡，就像蓄满水的大坝，一旦需求收缩，后果非常严重。**类似几年前，在万众创业背景下的客户端开发，走向终局，最终APP的竞争格局清晰，市场上惨绝人寰，培训班3个月出来35k的客户端神话就不再存在了。现在市面上真的是人人都在搞大模型，除了希望那一刻来的晚一点，也希望openAI多画点饼，让从业者和资金都有盼头。

定价主要靠市场规律，大模型算是短暂地出了一段技术红利期，这是15年之后，罕见的一次技术红利了，而目前来看，这个红利正在逐渐消失之中。

如果说用一个曲线来描绘的画，目前还处在愚昧之颠之后的下坡阶段，未来如果没有持续的突破，大概率要走向绝望之谷。

除了大环境的变化，我们再看看微观的变化。

1.候选人简历开始丰沛起来，校招大模型paper也不是稀罕物了，但有影响力和可泛化的工作不多，雕花较多。

2.候选人基本人手两个大模型项目了，虽然数量比较多，但成功可以说道的不太多。

3.大家的技术选型都更规范了和趋于统一了，megatron，deepspeed，vllm以及其魔改成为标准答案。

4.计算资源更丰富了，在千卡集群上跑过几千小时卡时实验的候选人也有。值得说道的训练和数据经验能很快吸引面试官。

5.有影响力的工作，扎实的成果，科学的认知判断，相对急缺的岗位成为特批offer的标配。

6.各家基座团队除了国外两家top 2，也没啥秘密可言了，充分的内部流动性让经验互相穿透。国内的差距逐渐缩小，与国外的差距依然存在。

用一句话总结来说：大模型人才市场，目前从一个供小于求的状态，逐渐走向高水位平衡。应用落地赛道相对不太乐观，基座仍有差距，继续保持高投入追赶的状态。各位任重道远～

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

程序员笑武

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
大模型来自面试的体会和分享 2024版

还是挺不错的。然后做的比较好的有，各种非助手的形态，互联网C端的比如评论区机器人，视频总结摘要，文章总结，搜索总结，从用户量维度看，算是相对成功，也能在很多APP上看到全量开放。虽然这些应用看起来都没那么炫酷，也很简单。这些应用共有的特点有，**接近基座原生能力，场景数据丰富，或者场景数据方便构造。**在落地应用上，离原生能力越远，需要大模型能力越高，需要越多的场景优质数据。
复制链接

扫一扫