RAG-Flow部署本地微调过的模型使用

在Ubuntu服务器上启动RAGFlow服务器

在这篇博客中,我们将介绍如何在Ubuntu服务器上启动RAGFlow服务器。我们将确保系统配置满足RAGFlow的要求,然后通过Docker Compose来启动服务器。

先决条件

在开始之前,请确保您已经安装了以下软件:

  • Docker
  • Docker Compose
  • Git

如果您还没有安装这些软件,可以参考以下链接进行安装:

配置系统参数

RAGFlow要求vm.max_map_count的值不小于262144。首先,我们需要确认当前系统的vm.max_map_count值,并根据需要进行调整。

确认 vm.max_map_count 的大小

打开终端并运行以下命令:

sysctl vm.max_map_count

如果输出的值小于262144,我们需要进行调整。

临时设置 vm.max_map_count

运行以下命令将vm.max_map_count的值设置为262144:

sudo sysctl -w vm.max_map_count=262144

永久设置 vm.max_map_count

要使设置在系统重启后仍然有效,需要编辑/etc/sysctl.conf文件。

使用以下命令编辑文件:

sudo nano /etc/sysctl.conf

在文件末尾添加以下行:

vm.max_map_count=262144

保存文件并退出编辑器。

克隆RAGFlow仓库

接下来,我们将克隆RAGFlow的Git仓库。

运行以下命令克隆仓库:

git clone https://github.com/infiniflow/ragflow.git

进入docker目录:

cd ragflow/docker

启动RAGFlow服务器

我们将使用提前编译好的Docker镜像来启动服务器。

赋予执行权限

运行以下命令赋予entrypoint.sh脚本执行权限:

chmod +x ./entrypoint.sh

配置Docker Compose文件

如果您想运行特定版本的RAGFlow Docker镜像,请在docker/.env文件中找到RAGFLOW_VERSION变量,并将其设置为对应的版本号。例如:

RAGFLOW_VERSION=v0.7.0

启动服务器

运行以下命令启动服务器:

docker compose -f docker-compose-CN.yml up -d

注意,运行上述命令会自动下载RAGFlow的开发版本Docker镜像。镜像文件大约9GB,下载过程可能需要一些时间,请耐心等待。

确认服务器状态

服务器启动成功后,您可以通过以下命令查看服务器日志,确认服务器是否正常运行:

docker logs -f ragflow-server

出现以下界面提示说明服务器启动成功:

    ____                 ______ __
   / __ \ ____ _ ____ _ / ____// /____  _      __
  / /_/ // __ `// __ `// /_   / // __ \| | /| / /
 / _, _// /_/ // /_/ // __/  / // /_/ /| |/ |/ /
/_/ |_| \__,_/ \__, //_/    /_/ \____/ |__/|__/
              /____/

 * Running on all addresses (0.0.0.0)
 * Running on http://127.0.0.1:9380
 * Running on http://x.x.x.x:9380
 INFO:werkzeug:Press CTRL+C to quit

启动Xinference 部署本地模型

Xinference是一款利用GPU加速推理的强大工具。本篇博客将指导您如何在安装了CUDA的机器上正确配置并启动Xinference Docker容器。

准备工作

启动Xinference容器

使用以下命令启动Xinference容器,将9997端口映射到宿主机的9998端口,并指定日志级别为DEBUG:

docker run \
  -v /data1:/data1 \
  -p 9997:9997 \
  --gpus all \
  xprobe/xinference:v<latest> \
  xinference-local -H 0.0.0.0

参数说明

  • -p 9998:9997: 将容器内的9997端口映射到宿主机的9998端口。
  • --gpus all: 使用所有可用的GPU。
  • xprobe/xinference:v<your_version>: 指定镜像版本,将<your_version>替换为实际版本号。
  • xinference-local -H 0.0.0.0 --log-level debug: 启动Xinference服务并设置日志级别为DEBUG。

警告

  • --gpus 参数必须指定,因为镜像需要运行在有GPU的机器上,否则会出现错误。
  • -H 0.0.0.0 参数也必须指定,否则在容器外无法连接到Xinference服务。
  • 可以指定多个-e选项设置多个环境变量。

在网页端注册本地模型

在这里插入图片描述

在网页端运行模型

在这里插入图片描述

  • 30
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值