书生·浦语(InternLM)-大模型实战营-春节课程-作业3

本文介绍了如何在书生浦语开源平台上复现课程中的知识库助手搭建过程,包括使用InternStudio、搭建环境(如conda和sentencepiece)、加载数据和知识库构建,以及进阶作业中的垂直领域专业知识库构建与部署。
摘要由CSDN通过智能技术生成

书生浦语项目首页:https://github.com/InternLM/InternLM
训练营课程首页:https://github.com/internLM/tutorial?tab=readme-ov-file
b站视频首页:OpenMMLab的个人空间-OpenMMLab个人主页-哔哩哔哩视频
课程简介(个人认知):介绍书生浦语开源平台体系,教会使用平台

本节课手册:https://github.com/InternLM/tutorial/blob/main/langchain/readme.md

基础作业

复现课程知识库助手搭建过程 (截图)

进阶作业

选择一个垂直领域,收集该领域的专业资料构建专业知识库,并搭建专业问答助手,并在 OpenXLab 上成功部署(截图,并提供应用地址)

--------------------------------------------------------------------------------------

基础作业 复现课程知识库助手搭建过程

web平台:InternStudio

一、搭建环境

1.1 创建开发机

1.2 搭建conda环境

此处感觉可以不按课程内容创建新conda环境,而是复用上节课已创建的环境:

1.3 下载sentencepiece数据

下载sentencepiece模型数据

1.4 下载nltk数据

视频中的wget好像不太行,wget无响应很久

​从gitee clone还挺快

解压taggers中averaged_perceptron_tagger和tokenizers里punkt

1.5. 下载项目代码---知识库内容

作为知识库内容

二、知识库搭建

2.1 加载数据

递归读,只要txt和md文件,返回目标文件列表。

加载后的知识库以向量形式保存在磁盘上

顺序完成教程中的 实例化自定义 LLM 与 Prompt Template、构建检索问答链、gradio的web_demo

python启动,绑ssh_key,用powershell做ssh端口映射

成功!

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值