使用 `trim_messages` 优化聊天消息长度

最新推荐文章于 2025-05-01 20:06:47 发布

srudfktuffk

最新推荐文章于 2025-05-01 20:06:47 发布

阅读量312

点赞数 14

文章标签： java 前端 python

本文链接：https://blog.csdn.net/srudfktuffk/article/details/145273634

版权

在使用聊天模型进行对话时，每个模型都有其有限的上下文窗口，限制了能够接收的最大文本长度。因此，在处理长消息或持续累积的聊天记录时，我们需要有效管理消息的长度。本文将介绍如何使用 trim_messages 工具来管理消息长度，以确保它们适合特定模型的上下文窗口。

技术背景介绍

在与聊天模型交互时，信息的上下文窗口限制意味着我们不能无限制地传递长消息。为了提升对话效率并避免超出上下文窗口的限制，我们可以通过不同的策略修剪消息列表。

核心原理解析

上下文窗口限制：模型处理的文本长度有限，超出则无法处理。
消息修剪策略：包括保留最后、最前的消息等策略。
自定义计数器：可以编写自定义函数来计算消息中的token（令牌）数量，以更精确地修剪消息。

代码实现演示

以下代码示例展示了如何使用 trim_messages 进行消息修剪。

# 安装必要的库
# pip install -U langchain-openai
# pip install tiktoken

from langchain_core.messages import AIMessage, HumanMessage, SystemMessage, trim_messages
from langchain_openai import ChatOpenAI

# 定义消息列表
messages = [
    SystemMessage("you're a good assistant, you always respond with a joke."),
    HumanMessage("i wonder why it's called langchain"),
    AIMessage("Well, I guess they thought ‘WordRope’ and ‘SentenceString’ just didn’t have the same ring to it!"),
    HumanMessage("and who is harrison chasing anyways"),
    AIMessage("Hmmm let me think.\n\nWhy, he's probably chasing after the last cup of coffee in the office!"),
    HumanMessage("what do you call a speechless parrot"),
]

# 使用 OpenAI API 进行消息修剪
trimmed_messages = trim_messages(
    messages,
    max_tokens=45,
    strategy="last",
    token_counter=ChatOpenAI(model="gpt-4o"),
    include_system=True,
)

print(trimmed_messages)