作业内容
基础作业:
复现课程知识库助手搭建过程 (截图)
进阶作业:
选择一个垂直领域,收集该领域的专业资料构建专业知识库,并搭建专业问答助手,并在 OpenXLab 上成功部署(截图,并提供应用地址)
作业流程基本上可以参考官方的说明文档
这里概述一下思路
- 环境配置LLM,主要是模型读取、Transformer、加速、实现流水线对话、分词工具、加速
- 模型下载,获取主办方的Model
- 配置Langchain环境:这里是langchain(主角)、gradio(实现web demo),chromadb(向量数据库)、sentence-transformers(开源词向量模型)、unstructured(处理非结构化数据)、markdown(读取markdown文件吧)
- 下载各种资源 sentence-transformers、NLTK (主要是防止再次联网)、项目代码(下吧,本地也可以看)
- 构建知识库,这里主办方比较巧妙的用上了自己的项目的文档和数据,不错不错!
- 构建向量数据库:这里主要是读取文件、使用sentence-transformers进行量化,并加载到chroma向量数据库
- 将LLM构造成LangChain调用的方法
- 构建问答链: 可以一步一步尝试问答过程
- 部署,启动!
然后偷偷魔改系统的prompt,赶作业实在来不及找数据了,呜呜呜~,希望官方大佬高抬贵手