LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理
LLM 技术图谱(LLM Tech Map)是将 LLM 相关技术进行系统化和图形化的呈现,此图谱主要特点是“专注于技术人视角”,不求从 LLM 产业角度汇聚信息,而是希望让从事相关工作或是想了解 LLM 的技术人有一个快速感知。
LLM 技术图谱(LLM Tech Map)从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。
核心价值:帮助技术人快速了解 LLM 的核心技术和关键方向。
1.基础设施
LLM 技术图谱(LLM Tech Map)的基础设施部分主要包括以下几个方面:
-
向量数据库:向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。
-
数据库向量支持:传统数据库通常不支持向量数据的存储和检索,数据库向量支持可以为传统数据库添加向量数据的存储和检索能力。
-
大模型框架、微调 (Fine Tuning):针对大模型的开发。
-
大模型训练平台与工具
1.1向量数据库
-
Milvus
-
Pinecone
-
Weaviate
-
Chroma
-
Qdrant
-
Vespa
-
Vald
-
Faiss
-
ScaNN
-
Vearch
-
AquilaDB
-
Marqo
-
LanceDB
-
Annoy
-
NucliaDB
-
DeepLake
-
MongoDB
1.2数据库向量支持
-
pgvector
-
Redis Vector
-
Elastic
-
SingleStoreDB
-
Solr
-
OpenSearch
-
ClickHouse
-
Rockset
-
Cassandra
-
Lucene
-
Neo4j
-
Kinetica
-
Supabase
-
Timescale
1.3大模型框架、微调 (Fine Tuning)
-
OneFlow
-
LMFlow
-
LoRA
-
Alpaca-LoRA
-
PEFT
-
ChatGLM-Efficient-Tuning
-
LLaMA-Efficient-Tuning
-
P-tuning v2
-
OpenLLM
-
h2o-llmstudio
-
xTuring
-
finetuner
-
YiVal
1.4大模型训练平台与工具
-
Pytorch
-
BMtrain
-
colossalAI
-
Tensorflow
-
PaddlePaddle
-
MindSpore
-
Deepspeed
-
XGBoost
-
Transformers
-
Apache MXNet
-
Ray
2.大模型
LLM 技术图谱(LLM Tech Map)的大模型部分主要包括以下几个方面:
-
备案上线的中国大模型:有牌照提供服务的大模型,需要注意的是大模型和相应的产品多半名称不同。
-
知名大模型:在全球范围内,已经发布了多款知名大模型,这些大模型在各个领域都取得了突破性的进展。
-
知名大模型应用:LLM 已经在多种应用场景中得到了应用,包括文本生成、机器翻译、问答、自然语言推理等。
2.1中国大模型
-
文心一言
-
云雀
-
GLM
-
紫东太初
-
百川
-
日日新
-
ABAB 大模型
-
书生通用大模型
-
混元大模型
2.2知名大模型
-
Llama 2
-
OpenLLaMA
-
百川
-
通义大模型
-
文心一言
-
StableLM
-
MOSS
-
Dolly
-
BLOOM
-
Falcon LLM
-
ChatGLM
-
PaLM 2
-
盘古
-
GPT-4
-
Stable Diffusion
-
DALL·E 3
2.3 知名大模型应用
-
ChatGPT
-
Claude
-
Cursor
-
Mochi Diffusion
-
Midjourey
-
DragGAN
-
Bard
-
Bing
3.AI Agent(LLM Agent)
AI Agent是一种能够自主运作并完成特定任务的计算实体或程序。它能够通过传感器感知周围环境,并根据感知到的信息做出决策,然后通过执行器采取行动。LLM Agent 是指基于 LLM 技术构建的智能代理,它可以用于各种任务,比如让机器与 ChatGPT 交互,一层一层挖掘信息,自动化完成任务;比如由机器人构成的虚拟小镇。
-
核心特点
-
自主性:AI Agent具有独立思考和行动的能力,能够在没有人类直接指导的情况下完成任务。
-
交互性:AI Agent能够与环境或其他Agent进行交互,这在游戏、对话系统、推荐系统等场景中尤为重要。
-
目的性:AI Agent设计有明确的目标或意图,其行为是为了实现这些目标。
-
适应性:AI Agent能够根据环境的变化调整自己的行为,以适应新的情境。
-
进化性:随着技术的发展,AI Agent的功能和智能水平也在不断提升。
-
技术特点
-
AI Agent与大模型的主要区别在于,大模型与人类之间的交互是基于prompt实现的,而AI Agent仅需给定一个目标,它就能够针对目标独立思考并做出行动。
-
AI Agent的核心驱动力是大模型,并在此基础上增加了规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件。
-
类型从工作模式来看,AI Agent可以分为以下三种类型:
-
单Agent:侧重于执行单一任务或一系列相关任务,且不需要与其他智能体进行交互。
-
多Agent:涉及多个智能体之间的协作和交互,以完成更复杂的任务。
-
混合Agent(人机交互Agent):结合了人类和智能体的交互,以实现更高效的任务执行。
-
Rivet
-
JARVIS
-
MetaGPT
-
AutoGPT
-
BabyAGI
-
NexusGPT
-
Generative Agents
-
Voyager
-
GPTeam
-
GPT Researcher
-
Amazon Bedrock Agents
4.AI 编程
AI编程是指利用计算机编程语言和技术来创建、训练和优化人工智能算法的过程。它涵盖了数据的收集、清洗、转换以及算法的选择和应用。AI编程是构建未来智能系统的关键,通过模拟人类智能的能力,使计算机能够执行类似于人类的决策和任务。编程语言如Python因其强大的数据处理库和简洁的语法,成为AI编程的常用工具。
-
codeium.vim
-
Cursor
-
GitHub Copilot
-
Comate
-
StableCode
-
CodeGeeX
-
TabbyML
-
CodeArts Snap
-
Code Llama
-
CodeFuse
-
姜子牙
-
CodeShell
5.工具和平台
LLM 技术图谱(LLM Tech Map)的工具和平台部分主要包括以下几个方面:
-
LLMOps:简单点说(大家当前在说的),就是“快速从大模型到应用”。
-
大模型聚合平台:汇聚大模型能力,提供服务。
-
开发工具:其它开发相关的 LLM 工具。
5.1 LLMOps
-
BentoML
-
LangChain
-
Dify.ai
-
Semantic Kernel
-
Arize-Phoenix
-
GPTCache
-
Flowise
5.2 大模型聚合平台(☆)
-
Gitee AI
-
SOTA!模型
-
魔搭ModelScope
-
Hugging Face
5.3 开发工具
-
v0
-
txtai
-
Jina-AI
-
Deco
-
imgcook
-
Quest AI
-
CodiumAI
-
Codeium Vim
-
Project IDX
-
MakerSuite
6.算力
LLM 模型的训练和部署需要大量的算力,算力是 LLM 技术发展的关键因素。
-
英伟达
-
昇腾
-
AMD
-
海光
-
昆仑芯
-
天数智芯
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。