AI大模型 、生成式AI、AI工具,必须知道的知识点

本文介绍了AI大模型(LLM)的概念,包括Transformer架构和其代表模型如GPT系列。讨论了关键术语如Prompt和RAG,以及实用工具如LangChain和Copilot在编程辅助中的应用,还提及了Tavus和Midjourney在生成领域的具体实例。
摘要由CSDN通过智能技术生成

一、什么是 AI 大模型 / LLM

AI 大模型,即LLM 是 "Large Language Model" 的缩写,意为大型语言模型。 它是一种基于 Transformer 架构并使用大量文本数据进行预训练的深度学习模型。

Transformer 是一种采用注意力机制的深度学习模型,这一机制可以按输入数据各部分重要性的不同而分配不同的权重。 该模型主要用于自然语言处理(NLP)与计算机视觉(CV)领域。

1.2 常见的 AI 大模型

  1. OpenAI 的 GPT-3 和 GPT-4
    1. GPT 是 "Generative Pre-trained Transformer" 的缩写,意为生成式预训练变换器。 它是 OpenAI 开发的一系列大型语言模型,该模型基于 Transformer 架构,并使用大量的文本数据进行预训练。
  2. 谷歌的 LaMDA 和 Gemini
  3. 微软的 Turing NLG
  4. 百度的 ERNIE 3.0 和 文心一言
  5. 阿里巴巴的 M6

二、常用术语

2.1 Prompt

是指在生成模型中用来引导模型生成输出的文本或代码。Prompt 的质量对模型生成的输出质量有很大的影响。

  • 使用简洁明了的 Prompt 来生成输出。
  • 使用具体的细节来控制输出的风格。
  • 尝试不同的 Prompt 来生成不同的输出。

2.2 RAG

是指生成对抗网络 (Generative Adversarial Networks) 的简称。RAG 是由两个神经网络组成的系统:生成器和判别器。生成器负责生成数据,判别器负责区分真实数据和生成数据。

  • 使用高质量的数据来训练 RAG。
  • 使用合适的超参数来训练 RAG。
  • 监控 RAG 的训练过程,并进行必要的调整。

三、常用的工具

  1. LangChain
    1. LangChain 是一个开源框架,用于构建基于大型语言模型(LLM)的应用程序。
  2. Copilot
    1. Copilot 是 GitHub 和 OpenAI 合作开发的一个人工智能工具,可以帮助程序员提高编码效率。 Copilot 可以自动生成代码、补全代码、修复代码错误等。
    2. Copilot 已经在 Visual Studio Code、Microsoft Visual Studio、Vim、Cursor、JetBrains 等集成开发环境中提供。

四、应用

  1. Tavus: 视频生成
  2. Midjourney: 根据文本生成图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值