大模型开发范式(LLM通用大模型)
- LLM大模型有强大的语言理解、指令跟随和原生成本能力,能够理解自然语言,具有强大的知识储备和一定的逻辑推理能力,可利用于多领域
- 缺点:时效性受限、专业能力有限、定制化成本高
- RAG和Finetune两种开发范式
LangChain
LangChain是一个开源工具,为LLM提供通用接口,帮助构建LLM应用
构建向量数据库
加载源文档--文档分块--文档向量化
InternLM 模型部署
- 下载和激活InternLM环境、安装依赖
- 下载模型internlm-chat-7b
- langChain相关环境配置
- 下载NLTK相关资源(NLTK:构建开源词向量的时候会使用NLTK的一些资源)
- 下载本项目代码turorial
知识库搭建
- 数据收集(OpenCompass、IMDeploy、XTuner、InternLM-XComposer、Lagent、InternLM库中的txt、md文件用这些当作语料库)。过程:读取文件--获取文件中的数据--把数据引入到 LangChain 框架中构建向量数据库
- internLM 接入LangChain
- 构建检索问答链
- 加载向量数据库
- 实例化一个基于 InternLM 和Prompt Template
- 生成问答链
- 部署
- 运行
作业
下载数据源并构建数据向量数据
连接LLM
部署demo
运行
连接到本地
结果