使用gradio快速构建llm聊天

格瑞Lxf

已于 2024-03-11 14:32:35 修改

阅读量1.2k

点赞数 4

文章标签： python 开发语言

于 2024-03-11 14:23:35 首次发布

本文链接：https://blog.csdn.net/China_boy007/article/details/136622815

版权

前期准备：

语言模型采用qwen7b，方法使用ollama。

llm = Ollama(base_url="http://localhost:11434",
                     model="qwen:7b",
                     callback_manager=CallbackManager([StreamingStdOutCallbackHandler()]),
                 )

embedding模型选用bge large zh

def embedding_data():
    '''
    embedding 数据     使用bge large zh模型，代替 openai的embeddings = OpenAIEmbeddings()
    '''
    model_name = MODEL_PATH['embed_model'][EMBEDDING_MODEL]
    model_kwargs = {'device': EMBEDDING_DEVICE}
    encode_kwargs = {'normalize_embeddings': True}
    # self.model = sentence_transformers.SentenceTransformer(model_name)
    model = HuggingFaceBgeEmbeddings(
        model_name=model_name,
        model_kwargs=model_kwargs,
        encode_kwargs=encode_kwargs
    )
    return model

知识库用chroma

全部代码如下：

import os

import gradio as gr
from langchain.chains.question_answering import load_qa_chain
from langchain_community.vectorstores.chroma import Chroma
from langchain_core.prompts import PromptTemplate

from utils.embedding_data import embedding_data
from utils.llm import load_llm
llm = load_llm()
QA_PROMPT="""使用以下上下文和聊天历史记录来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答案.

    上下文: {context}
    
    聊天历史记录: {chat_history}
    
    问题: {question}
    有帮助的答案:"""
QA_PROMPT = PromptTemplate(
    template=QA_PROMPT, input_variables=["context", "chat_history","question"]
)
# 加载数据库
persist_directory = os.path.join('knowledge_base', "chroma")
print(persist_directory)
# embedding model
model = embedding_data()
vectorstore = Chroma(persist_directory=persist_directory, embedding_function=model)
def echo(message, history):
    chain = load_qa_chain(llm, chain_type="stuff", prompt=QA_PROMPT)
    docs = vectorstore.as_retriever().get_relevant_documents(message)
    result = chain({"input_documents": docs, "question": message, "chat_history": history}, return_only_outputs=True)
    print(message,history)
    print(type(result['output_text']))
    print(type(message))
    return result['output_text']

demo = gr.ChatInterface(fn=echo, examples=["hello", "hola", "merhaba"], title="Echo Bot")
demo.launch(share=True)

需要更改的地方有：llm=load_llm，model=embedding()根据前期准备修改

数据库文件自行准备。

接口的好处可以用client直接调用