主讲人:邹雨衡
视频:(3)基于 InternLM 和 LangChain 搭建你的知识库_哔哩哔哩_bilibili
LLM的局限性
两种不同思路的大模型开发范式
RAG的特点:外挂知识库+知识库检索功能+提问——>大模型——>结果
FineTune:在一个较小的、新的数据集上进行微调
RAG基本思想
基于LangChain搭建RAG应用
知识数据库方面:1.提取文档为Text格式。2.对文档进行分割处理生成Chunks。3.使用sentences transform将Chunks转化为向量格式。4储存到chroma数据库。
输入:1.使用sentences transform将输入转换为统一维度的向量。2.在数据库中对输入向量进行相似度的匹配。
3.将相似的文段嵌入prompt template中最后输入给模型。
1.数据库的搭建
核心内容:1.不同的文段加载。2.切分的恰当。4.向量化选用模型和数据知识库的选用。
2.搭建知识库助手
3.优化方案
提供后续优化模型的方案
4.web demo部署
使用gradio和streamlit部署