深入理解LangChain：学习指南

Python程序员罗宾

于 2024-08-06 13:52:49 发布

阅读量446

点赞数 9

文章标签： langchain easyui 前端人工智能语言模型机器学习深度学习

本文链接：https://blog.csdn.net/aolan123/article/details/140953995

版权

LangChain 是一个强大的自然语言处理工具，为开发者提供了丰富的功能，涵盖了语言模型的初始化、对话链的构建、文本生成、量化、微调、记忆、索引等多个方面。

基础知识

模型 （Models）

LangChain中的模型是指任何语言模型，如OpenAI的text-davinci-003/gpt-3.5-turbo/4/4-turbo、LLAMA、FALCON 等，可用于各种自然语言处理任务。下面是一个初始化和使用语言模型的示例：

from langchain.llms import OpenAI``   ``# 初始化 OpenAI 语言模型``llm = OpenAI(model_name="text-davinci-003", temperature=0.01)``   ``# 使用模型生成文本``result = llm("Suggest 3 bday gifts for a data scientist")``print(result)``# 输出:``# 1. A subscription to a data science magazine or journal``# 2. A set of data science books``# 3. A data science-themed mug or t-shirt``

对话模型（Chat Models）

对话模型是 LangChain 中的一项重要功能，它允许我们以自然而灵活的方式进行交互。以下是一个使用对话链的示例：

from langchain.chat_models import ChatOpenAI``from langchain.schema import HumanMessage, AIMessage, SystemMessage``   ``# 初始化对话链``chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.01)``   ``# 构建对话历史``conversation_history = [`    `HumanMessage(content="Suggest 3 bday gifts for a data scientist"),`    `AIMessage(content="What is your price range?"),`    `HumanMessage(content="Under 100$"),``]``   ``# 获取对话链的回复``response = chat(conversation_history).content``print(response)

开源模型（Open-source Models）

LangChain 支持使用开源模型进行文本生成。下面是一个使用预训练语言模型进行文本生成的示例：

from auto_gptq import AutoGPTQForCausalLM``from transformers import AutoTokenizer``from torch import cuda``   ``# 初始化模型和tokenizer``model_name = "TheBloke/llama-2-13B-Guanaco-QLoRA-GPTQ"``tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True)``model = AutoGPTQForCausalLM.from_quantized(model_name, use_safetensors=True, trust_remote_code=True, device_map="auto", quantize_config=None)``   ``# 输入文本进行生成``query = "<Your input text here>"``input_ids = tokenizer(query, return_tensors="pt").input_ids.cuda()``output = model.generate(input_ids=input_ids, temperature=0.1)

文本生成（Text Generation）

在文本生成过程中，可以通过调整参数来影响生成的文本。以下是一些关键参数：

temperature： 影响令牌生成的随机性。
top_k： 限制每步令牌生成为最可能的前 k 个。
top_p（nucleus采样）：将令牌生成限制为累积概率为 p

llm = OpenAI(temperature=0.5, top_k=10, top_p=0.75, max_tokens=50)

进阶特性

动态提示 （Prompts）

LangChain 支持创建动态提示，以引导模型更好地理解用户的意图。以下是一个使用动态提示的示例：

from langchain.dynamic_prompt import DynamicPrompt``   ``# 初始化动态提示``dynamic_prompt = DynamicPrompt()``   ``# 添加提示步骤``dynamic_prompt.add_step("What type of gift are you looking for?")``dynamic_prompt.add_step("Any specific theme or interest?")``   ``# 获取生成的动态提示``prompt = dynamic_prompt.get_prompt()

记忆 （Memory）

LangChain 中的记忆功能允许模型保持对话历史，并在生成文本时参考先前的上下文。以下是一个使用记忆的示例：

from langchain.memory import Memory``   ``# 初始化记忆``memory = Memory()``   ``# 添加对话历史``memory.add_message("Suggest 3 bday gifts for a data scientist")``memory.add_message("What is your price range?")``memory.add_message("Under 100$")``   ``# 获取记忆内容``memory_content = memory.get_content()

索引（Indexes）

LangChain 支持索引功能，可以根据关键词或标签查找文本。以下是一个使用索引的示例：

from langchain.index import Index``   ``# 初始化索引``index = Index()``   ``# 添加文本到索引``index.add_text("Suggest 3 bday gifts for a data scientist", tags=["birthday", "gifts", "data scientist"])``index.add_text("What is your price range?", tags=["price", "budget"])``   ``# 根据标签检索文本``retrieved_text = index.retrieve_text_by_tag("birthday")

高级特性

量化（Quantization）

量化是 LangChain 中的关键性能优化手段。以下是一个优化预训练语言模型为 4bit 量化的示例：

from transformers import BitsAndBytesConfig, AutoModelForCausalLM``import torch``   ``model_name_or_path = "your-model-name-or-path"``   ``# 配置4位量化``bnb_config = BitsAndBytesConfig(`    `load_in_4bit=True,`    `bnb_4bit_compute_dtype=torch.bfloat16,`    `bnb_4bit_quant_type="nf4",`    `bnb_4bit_use_double_quant=True``)``   ``# 加载预训练模型并应用量化配置``model_4bit = AutoModelForCausalLM.from_pretrained(`    `model_name_or_path,``    quantization_config=bnb_config,`    `device_map="auto",`    `trust_remote_code=True``)``

微调（Fine-tuning）

在 LangChain 中，微调预训练语言模型是常见的操作，可通过 Low-Rank Adaptation（LoRA）等技术实现。以下是一个微调示例：

from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training``from transformers import AutoModelForCausalLM, Trainer, TrainingArguments, DataCollatorForLanguageModeling``   ``# 加载预训练模型``pretrained_model = AutoModelForCausalLM.from_pretrained("your-model-name")``   ``# 启用梯度检查点以提高内存效率``pretrained_model.gradient_checkpointing_enable()``   ``# 为低比特宽度训练准备模型``model = prepare_model_for_kbit_training(pretrained_model)``   ``# 配置LoRA（低秩适应）参数``config = LoraConfig(`    `r=16,`    `lora_alpha=32,`    `lora_dropout=0.05,`    `bias="none",`    `target_modules=["query_key_value"],`    `task_type="CAUSAL_LM"``)``   ``# 使用LoRA配置对模型进行微调``model = get_peft_model(model, config)``   ``# 初始化Trainer进行模型训练``trainer = Trainer(`    `model=model,`    `train_dataset=train_dataset,`    `args=TrainingArguments(`        `num_train_epochs=10,`        `per_device_train_batch_size=8,`        `# 其他训练参数...`    `),`    `data_collator=DataCollatorForLanguageModeling(tokenizer)``)``   ``# 在训练过程中禁用缓存以节省内存``model.config.use_cache = False``   ``# 启动训练过程``trainer.train()

代理和工具

LangChain 允许创建自定义代理和工具，以便执行特定任务。例如，可以创建一个将文本中的单位从英里转换为公里的工具，并将其整合到代理中：

from langchain.tools import StructuredTool, BaseTool``from langchain.agents import initialize_agent, AgentType``   ``# 定义文本处理工具``def text_processing(string: str) -> str:`    `return string.lower()``   ``text_processing_tool = StructuredTool.from_function(text_processing)``   ``# 初始化代理并使用自定义工具``agent = initialize_agent([text_processing_tool], llm, ``  agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True``)``   ``# 运行代理以执行文本处理``agent.run({"input": "Process the text: London is the capital of Great Britain"})

总结

LangChain 提供了强大而灵活的工具，使开发者能够轻松构建自然语言处理应用程序。通过深入了解 LangChain 可以更好地利用其功能，从而加速开发过程。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：