【RAG实战】基于 LangChain+Transformers+Qwen3 的RAG 智能产品助手实现

最新推荐文章于 2025-05-05 13:07:46 发布

大模型研究院

最新推荐文章于 2025-05-05 13:07:46 发布

阅读量554

点赞数 14

文章标签： langchain 人工智能 gpt 大模型大数据算法

本文链接：https://blog.csdn.net/l01011_/article/details/147709118

版权

1、背景介绍

就在2025年4月29日凌晨，阿里巴巴正式推出新一代大语言模型通义千问Qwen3，并宣布全面开源。这一消息瞬间引爆AI圈，被誉为“开源大模型王座再易主”的里程碑事件。作为国内首个支持“混合推理”的模型，Qwen3不仅在技术上实现颠覆性创新，更以开源生态加速行业变革。

Qwen3大模型的主要创新点有：

1、支持两种思考模式：

思考模式：在这种模式下，模型会逐步推理，经过深思熟虑后给出最终答案，适合需要深入思考的复杂问题。
非思考模式：在此模式中，模型提供快速、近乎即时响应，适用于对速度要求高于深度的简单问题。

2、多语言支持

Qwen3 模型支持 119 种语言和方言，其中包括印欧语系、汉藏语系、亚非语系、南岛语系、德拉威语、突厥语系、壮侗语系、乌拉尔语系、南亚语系等等。这一广泛的多语言能力为国际应用开辟了新的可能性，让全球用户都能受益于这些模型的强大功能。

3、增强的 Agent 能力

优化了 Qwen3 模型的 Agent 和代码能力，同时也加强了对 MCP 的支持。

请添加图片描述

本文基于 FastAPI+LangChain+Transformers+Qwen3+RAG 来实现一个智能产品助手，通过具体的项目实战来帮助大家学习如何基于Qwen3大模型来构建自己的AI应用。当下人工智能行业不缺AI算法专家和算法工程师，缺的是能基于大模型定制开发企业专用智能体或者应用的工程化人才，希望本文能帮你踏入大模型应用开发的大门，开启大模型应用开发工程师的精彩人生。

2、项目介绍

2.1 项目架构

2.2 项目实现原理：

实现步骤：

加载文件
读取文件
文本分割
文本向量化
问句向量化
在文本向量中匹配出与问句向量相似的top_k个
匹配出的文本作为上下文和问题一起添加到prompt中
提交给LLM生成答案

主要功能包括：

基于本地知识库的问答：系统可以根据用户的提问，在本地的知识库中进行搜索，并返回相关的答案。
多模型支持：项目支持使用不同的语言模型，可以根据需求选择合适的模型进行使用。
离线私有化：可以将该问答系统部署在本地环境中，确保数据的安全性和隐私性。

3、项目的执行流程

4、代码实现

4.1 安装依赖

pip install langchain 
pip install fastapi
pip install transfomers

这里只列举了部分，项目详细依赖可以看 requirements.txt 文件

4.2 模型下载

本项目采用离线方式运行，所以需要把qwen3和Embedding 模型下载到本地。

import os
from transformers import AutoModel, AutoTokenizer

os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"  # 国内镜像

# 下载千问3大模型
model_name = "Qwen/Qwen3-1.7B"  # 替换为你想下载的模型名称
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

# 保存到本地
save_path = "../models/qwen3"
model.save_pretrained(save_path)
tokenizer.save_pretrained(save_path)

# 下载embedding模型
model_name = "moka-ai/m3e-base"  # 替换为你想下载的模型名称
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModel.from_pretrained(model_name, trust_remote_code=True, force_download=True)
# 保存到本地
save_path = "../models/embedding"
model.save_pretrained(save_path)
tokenizer.save_pretrained(save_path)

4.3 主程序入口

import logging
from contextlib import asynccontextmanager
import uvicorn
from fastapi import FastAPI
from app.routers import chat
from app.services.rag_service import RAGService

# 日志配置
logging.basicConfig(  
  level=logging.DEBUG,    
  format='%(asctime)s - %(levelname)s - %(message)s',    
  handlers=[   
       logging.FileHandler("../app.log", encoding="utf-8"),  # 文件输出        
       logging.StreamHandler()  # 控制台输出  
         ]
)

# 应用启动执行
@asynccontextmanager
async def lifespan(app: FastAPI): 
   from app import rag  # 延迟导入，避免循环引用    
   rag.rag_service = RAGService()    
   logging.info("RAGService 初始化完成")    
   yield    
   logging.info("应用关闭，释放资源")

app = FastAPI(lifespan=lifespan)
app.include_router(chat.api_router)

if __name__ == "__main__":  
  uvicorn.run(app, host="0.0.0.0", port=8000)   
   pass

4.4 FastAPI服务

from fastapi import APIRouter, Depends
from app.schemas.user_input import UserInput
from app.services.qwen_chatbot import QwenChatbot
from app.rag import get_rag_service
from app.services.rag_service import RAGService

api_router = APIRouter(tags=["Qwen3"])

@api_router.post("/chat")
async def chat(query: UserInput, rag: RAGService = Depends(get_rag_service)):
   chatbot = QwenChatbot("../models/qwen3")    
   response = chatbot.generate_response(user_input=query.query, rag=rag)

return response

4.5 自定义QwenChatbot类

from langchain_core.prompts import PromptTemplate
from transformers import AutoModelForCausalLM, AutoTokenizer
from app.services.rag_service import RAGService

class QwenChatbot:   
 def __init__(self, model_name="Qwen/Qwen3-1.7B"):  
       self.tokenizer = AutoTokenizer.from_pretrained(model_name)        
       self.model = AutoModelForCausalLM.from_pretrained(    
               model_name,   
     )       
      self.history = []  

  def generate_response(self, user_input, rag: RAGService):  
        # 搜索相近内容       
         related_content = rag.retrieve_docs(user_input)        
         # 提示词模板        
         PROMPT_TEMPLATE = f"""             
                    基于以下已知信息，简洁和专业的来回答用户的问题。不允许在答案中添加编造成分。                        
                    已知内容:                       
                     {related_content}                       
                      问题:                       
                       {user_input}                    
"""      

  messages = self.history + [{"role": "user", "content": PROMPT_TEMPLATE}]        

text = self.tokenizer.apply_chat_template(    
        messages,            
        tokenize=False,            
        add_generation_prompt=True       
 )       

 inputs = self.tokenizer(text, return_tensors="pt")        
 response_ids = self.model.generate(**inputs, max_new_tokens=32768)[0][len(inputs.input_ids[0]):].tolist()       
  response = self.tokenizer.decode(response_ids, skip_special_tokens=True)        

# Update history       
 self.history.append({"role": "user", "content": user_input})        
 self.history.append({"role": "assistant", "content": response})       

 return response

4.6 RAG构建索引和知识库检索

import os
from pathlib import Path
import pandas as pd
from langchain.chains import RetrievalQA
from langchain.schema import Document
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_chroma import Chroma
from langchain_community.document_loaders import DirectoryLoader, TextLoader
from langchain_huggingface import HuggingFaceEmbeddings

class RAGService:  
  def __init__(self):       
   # 1. 找到项目根目录（rag_service.py 的上上一级）        
   BASE_DIR = Path(__file__).resolve().parent.parent.parent        
   self.docs_path = f"{BASE_DIR}/product_docs/"        
   self.persist_dir = f"{BASE_DIR}/chroma_dbs/"        
   self.chunk_size = 1000        
   self.chunk_overlap = 100        
   self.embedding_model = f"{BASE_DIR}/models/embedding"        
   self.k = 3        
   self._vectordb = None       
    self._initialize()    
 
   def _initialize(self):        
    # 如果已存在持久化目录，直接加载，否则重新构建      
      if os.path.exists(self.persist_dir) and os.listdir(self.persist_dir):            
      self._load_vectorstore()      
        else:        
            self._build_vectorstore()    

def _load_vectorstore(self):    
    """       
     从持久化目录加载 Chroma 向量数据库        
     """       
      embeddings = HuggingFaceEmbeddings(model_name=self.embedding_model)        
      self._vectordb = Chroma(    
              persist_directory=self.persist_dir,            
              embedding_function=embeddings      
  )    

def _build_vectorstore(self):  
      """        
      加载文档、分割并生成向量数据库，并持久化        
      """        
      # 分别加载 txt 和 xlsx 文件，避开单一 loader_cls dict        
      txt_loader = DirectoryLoader(     
             str(self.docs_path),          
               glob="**/*.txt",          
                 loader_cls=TextLoader,        
                     loader_kwargs={'encoding': 'utf-8'}  # 关键参数   
     )       
     xlsx_docs = []   
          for xlsx_file in Path(self.docs_path).glob("**/*.xlsx"):           
           # 读 Excel（默认就支持 .xlsx、.xls）          
             df = pd.read_excel(xlsx_file, sheet_name=None)  # sheet_name=None 会返回 dict，把所有 sheet 一并读入         
                # 如果你只关心第一个 sheet，可以写：df = pd.read_excel(xlsx_file)            
                # 如果读的是 dict（多个 sheet）         
                   if isinstance(df, dict):           
                        for sheet_name, sheet_df in df.items():                  
                          for _, row in sheet_df.iterrows():           
             # 把每行拼成一大段文本                    
                 content = "\n".join(f"{col}: {row[col]}" for col in sheet_df.columns)                        
                 xlsx_docs.append(Document(page_content=content))      
                       else:         
                              # 单个 DataFrame         
                                     for _, row in df.iterrows():               
                                          content = "\n".join(f"{col}: {row[col]}" for col in df.columns)                    
                                          xlsx_docs.append(Document(page_content=content))        

txt_docs = txt_loader.load()       
 documents = txt_docs + xlsx_docs       
  print(f"加载文档数：{len(documents)}")        

splitter = RecursiveCharacterTextSplitter(  
          chunk_size=self.chunk_size,           
           chunk_overlap=self.chunk_overlap,    
    )       
     split_docs = splitter.split_documents(documents)        
     print(f"分割后文档片段数：{len(split_docs)}")       
      embeddings = HuggingFaceEmbeddings(model_name=self.embedding_model)        self._vectordb = Chroma.from_documents(            
      split_docs,            
      embeddings,           
       persist_directory=self.persist_dir, 
       )   
 def retrieve_docs(self, user_input: str) -> str:    
     """        
只做语义检索，返回相关文档内容拼接（不调用 LLM）       
 """        
 docs = []        
# 优先检索城市信息       
 city_docs = self._vectordb.similarity_search(f"city:{user_input}", k=self.k)        docs.extend(city_docs)       
  # 然后检索县区信息        
  county_docs = self._vectordb.similarity_search(f"county:{user_input}", k=self.k)        
  docs.extend(county_docs)        
  # 处理多重结果并去重      
    docs = list({doc.page_content: doc for doc in docs}.values())       
     return "\n".join([doc.page_content for doc in docs])  
       def reload(self):    
           """       
            重新构建向量数据库，例如当文档更新后调用       
             """       
              self._build_vectorstore()

4.7 完整项目的下载地址：

https://github.com/leyu2017126/qwen3_rag_project.git

4.8 结果展示

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】