大模型开发--文搞懂 LangChain(二):Modell/O

最新推荐文章于 2024-09-18 10:31:17 发布

功城师

最新推荐文章于 2024-09-18 10:31:17 发布

阅读量868

点赞数 21

文章标签： langchain 人工智能自然语言处理 AI大模型大模型大模型应用 Modell/O

本文链接：https://blog.csdn.net/qingkahui24689/article/details/141186536

版权

本文将从Modeli/0的本质、Modell/o的原理、Modell/o的应用三个方面，带您一文搞懂 LangChain(二):Modell/O

Model I/O

一、Model I/O的本质

Model I/O 是什么？

在LangChain中，模型输入/输出（Model I/O）是指与 LLM 进行交互的组件，它弥合了原始输入数据和结构化输出之间的鸿沟。

Model I/O Introduction

Model I/O由几个部分组成。

Model **I/O能干什么？**

封装模型API和处理输入输出数据，实现了模型的顺畅交互，使得用户可以方便地利用模型完成各种任务。

Prompt Input - Generated Output

模型调用：通过封装好的API，Model I/O使得用户可以方便地调用不同的模型，如大型语言模型（LLM）或聊天模型（ChatModel），来完成各种任务，如文本生成、问答、翻译等。
输入封装：对于模型的输入，Model I/O提供了封装机制，可以处理各种类型的数据，如文本字符串、图像数据等，并将其转换为模型所需的特定格式。这包括数据的清洗、预处理和特征提取等步骤。
输出解析：对于模型的输出，Model I/O同样提供了封装机制来解析和处理结果。这可能包括将模型的输出转换为易于理解的格式、提取关键信息、进行后处理等步骤。

二、Model I/O的原理

Model I/O流程包含以下三个核心步骤：

Model I/O的工作流程

ModelI/O的核心组件：包括用于接收和生成文本的语言模型、指导输入格式的提示模板、筛选训练数据的示例选择器，以及解析模型输出的输出解析器。

语言模型 (Language Models)：
LLM： 大型语言模型，接收文本字符串作为输入，并返回相应的文本字符串作为输出。
ChatModel： 聊天模型，是语言模型的一种变体。接收聊天消息列表作为输入，并返回聊天消息作为输出。
提示模板 (Prompt Templates)：
PromptTemplate： 用于生成字符串提示。
ChatPromptTemplate： 用于生成聊天消息列表的提示。
示例选择器（Example Selectors）：
**训练新模型：**Example Selectors从数据集中筛选代表性的示例来训练新模型，确保其学习高质量、多样化的数据，提升学习效果和泛化能力。

**调优现有模型：**利用Example Selectors提供的新示例，对现有模型进行持续训练和调优，逐步改进其在特定任务上的表现，提高准确性和效率。
输出解析器（Output Parsers）：
Get format instructions： 返回一个字符串，其中包含要求语言模型应该返回什么格式内容的提示词。
Parse： 将模型返回的内容，解析为目标格式。