第三讲茴香豆：搭建你的RAG智能助理

最新推荐文章于 2024-07-16 01:00:13 发布

CharlesChenMS

最新推荐文章于 2024-07-16 01:00:13 发布

阅读量460

点赞数 3

文章标签：人工智能

本文链接：https://blog.csdn.net/cms90822/article/details/137678110

版权

按照课程教学使用茴香豆应用搭建个人智能助理，茴香豆web版网址：

https://openxlab.org.cn/apps/detail/tpoisonooo/huixiangdou-web

1、利用web版茴香豆创建助理：

界面长这样，上面输入自己只是库的名称，下面输入密码，点击前往就成功创建了一个知识库：

界面主要功能：1、添加文档：用于充实知识库；2、添加正反例：用于过滤不需要响应的问题；3、微信、飞书集成教程；4、网络搜索开关

首先，上传自己的文档：

上传后可以看到文档提取的状态：

总共7个成功了6个，这个成功率还是非常高的。

接下来是问答环节：

对文献的总结概括相当不错，下面还会给出相应的参考文献。然后针对其中的一个具体步骤进行了追问：

问答结果很好地从另一片文章里提取了相关的答案，因为上面的答案基本跟这片文章没有太大关系，所以这轮回答的结果真的是很好地提取了不同文章间的关联性。

接着，尝试了一下正反例的效果：

然后试了一下“今天中午吃什么好”和“哈哈哈哈”，回答如下：

出现了一个很奇怪的现象，感觉正反例没起作用还是啥情况，第一轮是检测相关度低，第二轮回答了第一轮的问题，这个还需要更多尝试。

2、在InternLMStudio上部署茴香豆技术助手

1、首先复制官方环境：

studio-conda -o internlm-base -t InternLM2_Huixiangdou

2、对茴香豆要用到的BCE模型和大模型创建软连接：

ln -s /root/share/new_models/maidalun1020/bce-embedding-base_v1 /root/models/bce-embedding-base_v1

ln -s /root/share/new_models/maidalun1020/bce-reranker-base_v1 /root/models/bce-reranker-base_v1

ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-7b /root/models/internlm2-chat-7b

3、安装python依赖：

pip install protobuf==4.25.3 accelerate==0.28.0 aiohttp==3.9.3 auto-gptq==0.7.1 bcembedding==0.1.3 beautifulsoup4==4.8.2 einops==0.7.0 faiss-gpu==1.7.2 langchain==0.1.14 loguru==0.7.2 lxml_html_clean==0.1.0 openai==1.16.1 openpyxl==3.1.2 pandas==2.2.1 pydantic==2.6.4 pymupdf==1.24.1 python-docx==1.1.0 pytoml==0.1.21 readability-lxml==0.8.1 redis==5.0.3 requests==2.31.0 scikit-learn==1.4.1.post1 sentence_transformers==2.2.2 textract==1.6.5 tiktoken==0.6.0 transformers==4.39.3 transformers_stream_generator==0.0.5 unstructured==0.11.2

4、下载茴香豆官方仓库：

git clone https://github.com/internlm/huixiangdou && cd huixiangdou
git checkout 447c6f7e68a1657fce1c4f7c740ea1700bde0440

5、修改配置文件里模型路径：

sed -i '6s#.*#embedding_model_path = "/root/models/bce-embedding-base_v1"#' /root/huixiangdou/config.ini

sed -i '7s#.*#reranker_model_path = "/root/models/bce-reranker-base_v1"#' /root/huixiangdou/config.ini

sed -i '29s#.*#local_llm_path = "/root/models/internlm2-chat-7b"#' /root/huixiangdou/config.ini

6、下载huixiangdou语料：

cd /root/huixiangdou && mkdir repodir

git clone https://github.com/internlm/huixiangdou --depth=1 repodir/huixiangdou

7、增加正反例：

cd /root/huixiangdou
mv resource/good_questions.json resource/good_questions_bk.json

echo '[
    "mmpose中怎么调用mmyolo接口",
    "mmpose实现姿态估计后怎么实现行为识别",
    "mmpose执行提取关键点命令不是分为两步吗，一步是目标检测，另一步是关键点提取，我现在目标检测这部分的代码是demo/topdown_demo_with_mmdet.py demo/mmdetection_cfg/faster_rcnn_r50_fpn_coco.py checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth   现在我想把这个mmdet的checkpoints换位yolo的，那么应该怎么操作",
    "在mmdetection中，如何同时加载两个数据集，两个dataloader",
    "如何将mmdetection2.28.2的retinanet配置文件改为单尺度的呢？",
    "1.MMPose_Tutorial.ipynb、inferencer_demo.py、image_demo.py、bottomup_demo.py、body3d_pose_lifter_demo.py这几个文件和topdown_demo_with_mmdet.py的区别是什么，\n2.我如果要使用mmdet是不是就只能使用topdown_demo_with_mmdet.py文件，",
    "mmpose 测试 map 一直是 0 怎么办？",
    "如何使用mmpose检测人体关键点？",
    "我使用的数据集是labelme标注的，我想知道mmpose的数据集都是什么样式的，全都是单目标的数据集标注，还是里边也有多目标然后进行标注",
    "如何生成openmmpose的c++推理脚本",
    "mmpose",
    "mmpose的目标检测阶段调用的模型，一定要是demo文件夹下的文件吗，有没有其他路径下的文件",
    "mmpose可以实现行为识别吗，如果要实现的话应该怎么做",
    "我在mmyolo的v0.6.0 (15/8/2023)更新日志里看到了他新增了支持基于 MMPose 的 YOLOX-Pose，我现在是不是只需要在mmpose/project/yolox-Pose内做出一些设置就可以，换掉demo/mmdetection_cfg/faster_rcnn_r50_fpn_coco.py 改用mmyolo来进行目标检测了",
    "mac m1从源码安装的mmpose是x86_64的",
    "想请教一下mmpose有没有提供可以读取外接摄像头，做3d姿态并达到实时的项目呀？",
    "huixiangdou 是什么？",
    "使用科研仪器需要注意什么？",
    "huixiangdou 是什么？",
    "茴香豆 是什么？",
    "茴香豆 能部署到微信吗？",
    "茴香豆 怎么应用到飞书",
    "茴香豆 能部署到微信群吗？",
    "茴香豆 怎么应用到飞书群",
    "huixiangdou 能部署到微信吗？",
    "huixiangdou 怎么应用到飞书",
    "huixiangdou 能部署到微信群吗？",
    "huixiangdou 怎么应用到飞书群",
    "huixiangdou",
    "茴香豆",
    "茴香豆 有哪些应用场景",
    "huixiangdou 有什么用",
    "huixiangdou 的优势有哪些？",
    "茴香豆 已经应用的场景",
    "huixiangdou 已经应用的场景",
    "huixiangdou 怎么安装",
    "茴香豆 怎么安装",
    "茴香豆 最新版本是什么",
    "茴香豆 支持哪些大模型",
    "茴香豆 支持哪些通讯软件",
    "config.ini 文件怎么配置",
    "remote_llm_model 可以填哪些模型?"
]' > /root/huixiangdou/resource/good_questions.json

8、将问题写入文件：

cd /root/huixiangdou

echo '[
"huixiangdou 是什么？",
"你好，介绍下自己"
]' > ./test_queries.json

9、测试拒答流程是否起效：

确实起作用了，识别出来“你还，介绍下自己”这是个不应该回答的问题。

10、正式对话：

可以从打印的日志里看到检索资料和生成prompt以及与语言模型交互的过程。

也能识别出无关的问题。

CharlesChenMS

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
第三讲茴香豆：搭建你的RAG智能助理

问答结果很好地从另一片文章里提取了相关的答案，因为上面的答案基本跟这片文章没有太大关系，所以这轮回答的结果真的是很好地提取了不同文章间的关联性。界面主要功能：1、添加文档：用于充实知识库；2、添加正反例：用于过滤不需要响应的问题；3、微信、飞书集成教程；出现了一个很奇怪的现象，感觉正反例没起作用还是啥情况，第一轮是检测相关度低，第二轮回答了第一轮的问题，这个还需要更多尝试。对文献的总结概括相当不错，下面还会给出相应的参考文献。确实起作用了，识别出来“你还，介绍下自己”这是个不应该回答的问题。
复制链接

扫一扫