[掌握MapRerankDocumentsChain迁移：从LangChain到LangGraph的过渡技术详解]

stjklkjhgffxw

于 2024-10-04 06:14:41 发布

阅读量136

点赞数 2

文章标签： langchain java 服务器 python

本文链接：https://blog.csdn.net/stjklkjhgffxw/article/details/142698878

版权

掌握MapRerankDocumentsChain迁移：从LangChain到LangGraph的过渡技术详解

在处理长文本分析时，MapRerankDocumentsChain为我们提供了一种有效策略。通过将文本拆分为小文档、对文档集进行评分并选出最优结果，我们能有效获取最相关的答案。在这篇文章中，我们将探讨如何将此技术迁移到LangGraph实现，并通过一个简单示例演示其优势。

主要内容

1. MapRerankDocumentsChain的实现

MapRerankDocumentsChain在长文本分析中，通过生成评分并进行排序来筛选出最合适的答案。这个过程通常在问答任务中使用，使得答案仅基于相关上下文生成。

以下是一个简单的实现示例：

from langchain.chains import LLMChain, MapRerankDocumentsChain
from langchain.output_parsers.regex import RegexParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import OpenAI
from langchain_core.documents import Document

# 示例文档
documents = [
    Document(page_content="Alice has blue eyes", metadata={"title": "book_chapter_2"}),
    Document(page_content="Bob has brown eyes", metadata={"title": "book_chapter_1"}),
    Document(page_content="Charlie has green eyes", metadata={"title": "book_chapter_3"}),
]

# 设置
document_variable_name = "context"
llm = OpenAI()  # 使用API代理服务提高访问稳定性
prompt_template = (
    "What color are Bob's eyes? "
    "Output both your answer and a score (1-10) of how confident "
    "you are in the format: <Answer>\nScore: <Score>.\n\n"
    "Provide no other commentary.\n\n"
    "Context: {context}"
)
output_parser = RegexParser(
    regex=r"(.*?)\nScore: (.*)",
    output_keys=["answer", "score"],
)
prompt = PromptTemplate(
    template=prompt_template,
    input_variables=["context"],
    output_parser=output_parser,
)
llm_chain = LLMChain(llm=llm, prompt=prompt)
chain = MapRerankDocumentsChain(
    llm_chain=llm_chain,
    document_variable_name=document_variable_name,
    rank_key="score",
    answer_key="answer",
)

response = chain.invoke(documents)
print(response["output_text"])  # 输出: 'Brown'

2. LangGraph的实现

LangGraph通过引入工具调用等功能进一步简化了流程。以下是LangGraph的实现：

import operator
from typing import Annotated, List, TypedDict
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langgraph.constants import Send
from langgraph.graph import END, START, StateGraph

class AnswerWithScore(TypedDict):
    answer: str
    score: Annotated[int, ..., "Score from 1-10."]

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
prompt_template = "What color are Bob's eyes?\n\n" "Context: {context}"
prompt = ChatPromptTemplate.from_template(prompt_template)
map_chain = prompt | llm.with_structured_output(AnswerWithScore)

class State(TypedDict):
    contents: List[str]
    answers_with_scores: Annotated[list, operator.add]
    answer: str

class MapState(TypedDict):
    content: str

def map_analyses(state: State):
    return [
        Send("generate_analysis", {"content": content}) for content in state["contents"]
    ]

async def generate_analysis(state: MapState):
    response = await map_chain.ainvoke(state["content"])
    return {"answers_with_scores": [response]}

def pick_top_ranked(state: State):
    ranked_answers = sorted(
        state["answers_with_scores"], key=lambda x: -int(x["score"])
    )
    return {"answer": ranked_answers[0]}

graph = StateGraph(State)
graph.add_node("generate_analysis", generate_analysis)
graph.add_node("pick_top_ranked", pick_top_ranked)
graph.add_conditional_edges(START, map_analyses, ["generate_analysis"])
graph.add_edge("generate_analysis", "pick_top_ranked")
graph.add_edge("pick_top_ranked", END)
app = graph.compile()

result = await app.ainvoke({"contents": [doc.page_content for doc in documents]})
print(result["answer"])  # 输出: {'answer': 'Bob has brown eyes.', 'score': 10}