1、学习地址
视频链接:https://www.bilibili.com/video/BV1sT4y1p71V/
文档:https://github.com/InternLM/tutorial/tree/main/langchain
第三节课作业:https://github.com/InternLM/tutorial/discussions/182
带三节课笔记:https://github.com/InternLM/tutorial/discussions/181
课程文档与视频讲解,对应操作即可
基于 InternLM 和 LangChain 搭建你的知识库 (yuque.com)
2、复现问题解决
huggingface-cli: command not found
按照该文档解决即可
https://github.com/huggingface/huggingface_hub/issues/1079
具体如下:
1、确保环境已将安装huggingface-cli
2、版本需要旧版,pip install huggingface_hub==0.20.1
3、再按如下执行
# Taken from https://stackoverflow.com/a/62151306
echo "export PATH=\"`python3 -m site --user-base`/bin:\$PATH\"" >> ~/.bashrc
source ~/.bashrc
基础作业:
复现课程知识库助手搭建过程 (截图)
进阶作业:
选择一个垂直领域,收集该领域的专业资料构建专业知识库,并搭建专业问答助手,并在 OpenXLab 上成功部署(截图,并提供应用地址)
可以对比该检索问答链和纯 LLM 的问答效果
3、进阶作业(未部署openxlab)
下载气象局官网公布的各媒体发布报道,复制为txt文件,作为本地数据。
生成本地向量库,并运行web_demo
“天帮忙”“人努力”“举措实” 全面推进农业气象观测自动化--经济·科技--人民网 (people.com.cn)
由于数据库样本量过小,存在一些幻觉。毕竟不是sql
4、基础作业
数据源
基座模型
外加向量库的模型