使用 HyDE 改善 RAG 回复的精确度

本文链接：https://blog.csdn.net/u014297502/article/details/143023361

一般的RAG检索流程：
在这里插入图片描述
使用 HyDE 改善RAG：

通过 HyDE，query embedding我做了一些改进。首先让 LLM 生成回答查询的文档，然后将生成的虚拟答案转换为嵌入，而不是直接将查询转换为嵌入。

代码实现：

from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import LLMChain, HypotheticalDocumentEmbedder
from langchain.prompts import PromptTemplate
from langchain.chat_models import ChatOpenAI
from dotenv import load_dotenv
# set the environment variables
load_dotenv()

# prepare the prompt template for document generation
Prompt_template = """回答问题。
问题：{question}
回答：”””
llm = ChatOpenAI()
# multi_llm = ChatOpenAI(n=4)
prompt = PromptTemplate(input_variables=["question"], template=prompt_template)
llm_chain = LLMChain(llm=llm, prompt=prompt, verbose=True)

# initialize the hypothetical document embedder
base_embeddings = OpenAIEmbeddings()
embeddings = HypotheticalDocumentEmbedder(llm_chain=llm_chain, base_embeddings=base_embeddings)

result = embeddings.embed_query("塞尔达传说的主角是谁？")
len(result)