一、什么是 AI 大模型 / LLM
AI 大模型,即LLM 是 "Large Language Model" 的缩写,意为大型语言模型。 它是一种基于 Transformer 架构并使用大量文本数据进行预训练的深度学习模型。
Transformer 是一种采用注意力机制的深度学习模型,这一机制可以按输入数据各部分重要性的不同而分配不同的权重。 该模型主要用于自然语言处理(NLP)与计算机视觉(CV)领域。
1.2 常见的 AI 大模型
- OpenAI 的 GPT-3 和 GPT-4
- GPT 是 "Generative Pre-trained Transformer" 的缩写,意为生成式预训练变换器。 它是 OpenAI 开发的一系列大型语言模型,该模型基于 Transformer 架构,并使用大量的文本数据进行预训练。
- 谷歌的 LaMDA 和 Gemini
- 微软的 Turing NLG
- 百度的 ERNIE 3.0 和 文心一言
- 阿里巴巴的 M6
二、常用术语
2.1 Prompt
是指在生成模型中用来引导模型生成输出的文本或代码。Prompt 的质量对模型生成的输出质量有很大的影响。
- 使用简洁明了的 Prompt 来生成输出。
- 使用具体的细节来控制输出的风格。
- 尝试不同的 Prompt 来生成不同的输出。
2.2 RAG
是指生成对抗网络 (Generative Adversarial Networks) 的简称。RAG 是由两个神经网络组成的系统:生成器和判别器。生成器负责生成数据,判别器负责区分真实数据和生成数据。
- 使用高质量的数据来训练 RAG。
- 使用合适的超参数来训练 RAG。
- 监控 RAG 的训练过程,并进行必要的调整。
三、常用的工具
- LangChain
- LangChain 是一个开源框架,用于构建基于大型语言模型(LLM)的应用程序。
- Copilot
- Copilot 是 GitHub 和 OpenAI 合作开发的一个人工智能工具,可以帮助程序员提高编码效率。 Copilot 可以自动生成代码、补全代码、修复代码错误等。
- Copilot 已经在 Visual Studio Code、Microsoft Visual Studio、Vim、Cursor、JetBrains 等集成开发环境中提供。
四、应用
- Tavus: 视频生成
- Midjourney: 根据文本生成图