第三节课作业

本文介绍了如何在Python环境中配置和使用InternML-demo,包括模型安装、LangChain相关设置,以及如何利用开源工具如OpenCompass和IMDeploy构建知识库。还详细说明了如何接入LangChain,通过Gradio部署WebDemo,以及进阶作业中使用pytorch中文文档进行RAG问答系统的搭建和评价。
摘要由CSDN通过智能技术生成

                                                                基础作业

1环境配置

1.1使用之前InternML-demo环境

1.2使用之前InternML-demo拷贝的模型

1.3LangChain 相关环境配置

安装以依赖包:

 Sentence Transformer下载:

1.4下载NLTK相关资源

1.5下载项目代码:

2. 知识库搭建

2.1数据收集,

选择由上海人工智能实验室开源的一系列大模型工具开源仓库作为语料库来源,包括:

  • OpenCompass:面向大模型评测的一站式平台
  • IMDeploy:涵盖了 LLM 任务的全套轻量化、部署和服务解决方案的高效推理工具箱
  • XTuner:轻量级微调大语言模型的工具库
  • InternLM-XComposer:浦语·灵笔,基于书生·浦语大语言模型研发的视觉-语言大模型
  • Lagent:一个轻量级、开源的基于大语言模型的智能体(agent)框架
  • InternLM:一个开源的轻量级训练框架,旨在支持大模型训练而无需大量的依赖

 加载数据,构建向量知识库到开发机本地磁盘

3 InternLM 接入 LangChain

      教程LLM.py

4、5构建检索问答链, web demo

基于 Gradio 框架将其部署到 Web 网页,开发机运行端口7860

本地电脑终端映射开发机端口

本地电脑浏览器打开http://127.0.0.1:7860/会话

                                                                     

                                               进阶作业(基于pytorch中文文档的RAG问答小助手)

1 .环境配置(参见Tutorial/langchain at main · InternLM/Tutorial (github.com)

2数据集收集:github仓库中的pytorch中文教程

# 进入到数据库盘
cd /root/data
git clone https://github.com/apachecn/pytorch-doc-zh.git

加载数据并用开源词向量模型 Sentence Transformer 来进行文本向量化 

 Chroma 作为向量数据库,基于上文分块后的文档以及加载的开源向量化模型,将语料加载到指定路径下的向量数据库

3 InternLM 接入 LangChain

4部署 Web Demo

5结果:

评价:实用性有待加强

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值