AI小白的快速入门-大语言模型中的名词，一文带你了解-CSDN博客

本文链接：https://blog.csdn.net/lvaolan8888/article/details/139099713

随着人工智能(AI)的快速发展，越来越多的人开始对这一领域产生浓厚的兴趣。但对于初学者来说，AI开发中的诸多名词可能会让人感到困惑。今天，我们就来一起解密AI开发中的常见名词，让你轻松入门！

1.Prompt（提示）

在人工智能（AI）和机器学习的上下文中，"prompt"一词通常指的是给模型提供的输入或查询，以引导模型生成特定的输出或响应。这种输入可以是一个问题、一段文字、一张图片或其他类型的数据，具体取决于模型的类型和应用场景。

Prompt在人与AI的交互过程中起到了桥梁的作用。无论是与大模型交互，还是使用基于大模型开发的应用，都需要通过Prompt去触发AI模型完成任务。可以把AI模型理解为一个人，需要通过它听得懂的语言和方式来跟它交流，从而让它理解我们的需求，产生有用的回答。因此，一个清晰、准确的Prompt能够帮助AI模型更准确地理解用户的意图和需求，从而生成更符合期望的输出。

Prompt在整个AI中扮演着至关重要的角色，我们完全可以将它称为大模型的编程语言。一个清晰、准确的prompt可以帮助模型更准确地理解用户的意图和需求，从而生成更符合期望的输出。相反，一个模糊或歧义的prompt可能导致模型产生不准确的输出或完全误解用户的意图。可以这么说在大模型实际上都是围绕着prompt进而表现出各种超乎预期的功能，学习和使用prompt是贯穿整个ai始终。

prompt有多重要，参考下openai为prompt工程师拟写的指导就可以知道，链接如下：

Prompt engineering - OpenAI API

2.Models（模型）

当我们谈论AI或机器学习时，经常会听到“模型”这个词。但模型到底是什么呢？其实，说得简单一点，模型就是那个包含了很多参数的文件。

你可以把模型想象成一个“食谱”。食谱上列出了做一道菜所需要的所有原料和步骤，而模型里的参数就像是这些原料和步骤的具体数值和顺序。只不过，模型是用来“做”出预测或决策的，而不是菜。

这些参数是怎么来的呢？它们是通过训练得来的。训练模型，就像是根据很多已知的例子（比如，已知的图片和对应的标签）来调整这些参数，使得模型能够尽可能地准确地进行预测或决策。

训练完成后，我们就可以保存这个模型，也就是保存这些参数到一个文件中。之后，当我们需要用这个模型来做预测或决策时，只需要加载这个文件，输入新的数据，模型就会根据之前学到的“知识”来给出结果。

几乎每一个你使用的大语言模型相关工具，例如ChatGPT，都是基于一个模型进行推理和输出，根据你给出的Prompt，推理出一个一个的输出。

Embedding（嵌入）

嵌入是一种将离散型数据（如文本、图像等）转换为连续向量表示的技术。简单来说，就是把复杂的数据转换成计算机更容易理解的形式。在自然语言处理中，词嵌入（Word Embedding）是常用的一种技术，它可以将每个单词表示为一个向量，使得语义上相似的单词在向量空间中相互靠近。这样，计算机就能更好地理解文本的含义和上下文关系。

大语言模型概念中常提到的RAG（检索增强生成，Retrieval-Augmented Generation）就和Embedding有着相辅相成的关系。RAG是一种利用检索技术来增强生成模型性能的方法。在RAG框架中，检索组件负责从大量文档中检索与当前生成任务最相关的信息，然后将这些信息提供给生成模型以指导其生成更准确、更相关的内容。这种方法结合了检索和生成的优点，能够处理复杂、开放域的生成任务。

Embedding在RAG中发挥着关键作用，Embedding为RAG提供了必要的语义向量表示和检索能力。首先，Embedding用于将文档和查询转换为向量表示，这使得检索组件可以计算它们之间的相似性并进行有效的检索。其次，高质量的Embedding可以提高检索的准确性和效率，从而确保生成模型获得最相关的信息。最后，Embedding还可以直接用于初始化生成模型的参数，为生成过程提供有用的语义信息。

4. Fine-Tuning（微调）

微调是在预训练模型的基础上进行调整以适应特定任务的过程。想象一下，你有一个已经训练有素的模型，但你需要让它适应一个新的场景或任务。这时，你就可以通过微调来优化模型的性能。微调不仅可以节省大量训练时间和资源，还能让模型更好地适应特定任务的需求。