WSL2+ChatGLM2+FastGPT+oneapi本地化部署

最新推荐文章于 2024-07-20 10:30:00 发布

金桃不烦恼

最新推荐文章于 2024-07-20 10:30:00 发布

阅读量2.9k

点赞数 33

文章标签： oneapi docker chatgpt

本文链接：https://blog.csdn.net/weixin_42118737/article/details/138497937

版权

本文记录自己在Win11电脑上部署fastGPT、连接本地大模型ChatGLM2-6b及其相关的工具的详细过程。最近离职在家，想跑通了一套流程后再去找工作，进程有点慢，呜呜。

首先，接上一篇在本地部署大模型chatGLM2-6B并采用各种api和网页demo进行调用，现在已过去好几天。

也是从chatGLM的社区了解到oneapi又间接了解到可以链接知识库得工具fastGPT，这必须要给他弄通啊。

直接先打开官方网址：

Docker Compose 快速部署 | FastGPT (fastai.site)

看一眼架构图：

大概也能看懂，fastGPT后台采用MongoDB和PostgreSQL存储数据，提供前后端应用，在通过oneapi集成各种大模型（包括语言模型和向量模型），再外接知识库进行补充修正，真的很nice。

话不多说，开始部署：

环境：

1、安装WSL2（windows子系统）

如果电脑只用作跑模型，建议直接安装Ubuntu22.04桌面版，或者安装双系统，这样后续操作可能不会遇到那么多坑。

如果想在自己的个人电脑搞大模型，又不影响别的，只能说WSL2真的香。

安装wsl最重要的是微软官方这篇：旧版 WSL 的手动安装步骤 | Microsoft Learn

1.1 启用适用于 Linux 的 Windows 子系统

需要先启用“适用于 Linux 的 Windows 子系统”可选功能，官方命令：

dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart

1.2 检查运行 WSL 2 的要求

需要检查系统是否满足：

我们电脑系统我为Win11，因此可以继续。

1.3 启用虚拟机功能

官方命令：

dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart

PS:可能需要在bios设置中，打开电脑的虚拟化（自行百度，开机按esc\del或者F2、F12这些进入）。

1.1和1.3可以通过启用和关闭windows功能进行设置：

也可打开启用或关闭windows功能：

勾选以下两项：

点击应用。

1.4下载 Linux 内核更新包

Linux 内核更新包会安装最新版本的 WSL 2 Linux 内核，以便在 Windows 操作系统映像中运行 WSL。

1.5将 WSL 2 设置为默认版本

wsl --set-default-version 2

1.6下载Linux发行版，并安装

推荐直接下载.appx文件再采用命令进行安装：

下载链接（网速嗖嗖快~）：

Ubuntu 22.04 LTS

命令：

Add-AppxPackage .\app_name.appx

切换到下载目录，并替换安装包名称，即可安装成功。

我这里顺带安装windows终端：

安装完成后的界面：

点击，就直接能够进入Ubuntu的终端了：

也可以通过终端那里的下三角符号进入：

2、安装docker

2.1下载docker desktop

wsl2安装成功了，docker也差不多完事了：

到网址：

Docker Desktop: The #1 Containerization Tool for Developers | Docker

下载windows安装包：

然后双击，下一步，下一步就按照好了。

2.2设置

我们可以打开：

点击设置：

设置镜像下载位置：

启用Ubuntu

好了，ok。

3、通过docker部署fastGPT

看这一步：

我们建立，在windows终端中建立目录，并执行：

curl -O https://raw.githubusercontent.com/labring/FastGPT/main/files/deploy/fastgpt/docker-compose.yml
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/projects/app/data/config.json

可以看到这两个文件：

如果因为网络不能执行成功，官方贴心的放到了文档里，点击下载：

再看下一步：

运行：

# 启动容器
docker-compose up -d
# 等待10s，OneAPI第一次总是要重启几次才能连上Mysql
sleep 10
# 重启一次oneapi(由于OneAPI的默认Key有点问题，不重启的话会提示找不到渠道，临时手动重启一次解决，等待作者修复)
docker restart oneapi

运行完这里，我们可以在docker中看到容器的运行情况：

fastGPT已经在正常运行了。我们登录本地127.0.0.1:3000可以看到登录界面:

这时输入：

账号：root

密码1234，就可以登录fastGPT了。

但是我们需要先把oneapi跑通

4、调试Oneapi

登录网址：http://127.0.0.1:3001/

账户：root 密码：123456

登录后需要修改为8位数。

添加渠道：

设置如下：

重点是模型名称和代理那里，模型名称后续需要严格一致，模型名称自定义一个，点击填入即可。

代理要设置成本地IP加8000端口，又不能带v1。

本地ip通过ipconfig进行查看。

对于本地chatGLM,密钥那里应该可以空着，没事，要么就填个none。

点击提交。

点击测试：

正确配置是能够测试成功的！

再建立一个令牌：

选择我们建立那个模型：

我们可以通过postman进行测试：

模型名称一定要严格对应：

看看回答：

opeapi在本地是可以联通的了。

令牌这里这个聊天，可以测试对话是否能成功：

这个跟之前在本地部署的NextChat一模一样。

设置一下：

也可以测试成功：

5、调试fastGPT

好了，oneapi也调试通了，可以将大模型连接到fastGPT，尝试接入知识库了吧！

网上找教程：例如这个：

全部本地化！ChatGLM+oneapi+fastgpt+微秘+微信部署实操_fastgpt 微信-CSDN博客

以及这个搭桥！接通本地大模型+知识库，部署one api搞掂，让知识库拥有大模型能力！17/45 - 知乎 (zhihu.com)

但是主要涉及两个配置：

一是：

二是：

这里面有两个坑。首先这些教程中的fastGPT版本都是4.6.8以前的版本。这在config.json中体现为：

就是前面chatModels那里，需要现在改成这样了.

后边我因为没有跑通，直接进行降级了，但最终的原因不是那个。

降级操作：

调整docker-compose.yml文件中的版本号：

执行：

docker-compose pull
docker-compose up -d

其实也是官方文档：

但这里有需要之前版本config.json文件，需要的进行复制-保存即可：

{
  "systemEnv": {
    "openapiPrefix": "fastgpt",
    "vectorMaxProcess": 15,
    "qaMaxProcess": 15,
    "pgHNSWEfSearch": 100
  },
  "chatModels": [
    {
      "model": "chatGLM2-6b", 
      "name": "chatGLM2-6b", 
      "maxContext": 8000, 
      "maxResponse": 4000, 
      "quoteMaxToken": 2000, 
      "maxTemperature": 1, 
      "vision": false, 
      "defaultSystemChatPrompt": "" 
    },
    {
      "model": "gpt-3.5-turbo",
      "name": "GPT35",
      "inputPrice": 0,
      "outputPrice": 0,
      "maxContext": 4000,
      "maxResponse": 4000,
      "quoteMaxToken": 2000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": false,
      "defaultSystemChatPrompt": ""
    },
    {
      "model": "gpt-3.5-turbo-16k",
      "name": "GPT35-16k",
      "maxContext": 16000,
      "maxResponse": 16000,
      "inputPrice": 0,
      "outputPrice": 0,
      "quoteMaxToken": 8000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": false,
      "defaultSystemChatPrompt": ""
    },
    {
      "model": "gpt-4",
      "name": "GPT4-8k",
      "maxContext": 8000,
      "maxResponse": 8000,
      "inputPrice": 0,
      "outputPrice": 0,
      "quoteMaxToken": 4000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": false,
      "defaultSystemChatPrompt": ""
    },
    {
      "model": "gpt-4-vision-preview",
      "name": "GPT4-Vision",
      "maxContext": 128000,
      "maxResponse": 4000,
      "inputPrice": 0,
      "outputPrice": 0,
      "quoteMaxToken": 100000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": true,
      "defaultSystemChatPrompt": ""
    }
  ],
  "qaModels": [
    {
      "model": "gpt-3.5-turbo-16k",
      "name": "GPT35-16k",
      "maxContext": 16000,
      "maxResponse": 16000,
      "inputPrice": 0,
      "outputPrice": 0
    }
  ],
  "cqModels": [
    {
      "model": "gpt-3.5-turbo",
      "name": "GPT35",
      "maxContext": 4000,
      "maxResponse": 4000,
      "inputPrice": 0,
      "outputPrice": 0,
      "toolChoice": true,
      "functionPrompt": ""
    },
    {
      "model": "gpt-4",
      "name": "GPT4-8k",
      "maxContext": 8000,
      "maxResponse": 8000,
      "inputPrice": 0,
      "outputPrice": 0,
      "toolChoice": true,
      "functionPrompt": ""
    }
  ],
  "extractModels": [
    {
      "model": "gpt-3.5-turbo-1106",
      "name": "GPT35-1106",
      "maxContext": 16000,
      "maxResponse": 4000,
      "inputPrice": 0,
      "outputPrice": 0,
      "toolChoice": true,
      "functionPrompt": ""
    }
  ],
  "qgModels": [
    {
      "model": "gpt-3.5-turbo-1106",
      "name": "GPT35-1106",
      "maxContext": 1600,
      "maxResponse": 4000,
      "inputPrice": 0,
      "outputPrice": 0
    }
  ],
  "vectorModels": [
    {
      "model": "text-embedding-ada-002",
      "name": "Embedding-2",
      "inputPrice": 0,
      "outputPrice": 0,
      "defaultToken": 700,
      "maxToken": 3000,
      "weight": 100
    }
  ],
  "reRankModels": [],
  "audioSpeechModels": [
    {
      "model": "tts-1",
      "name": "OpenAI TTS1",
      "inputPrice": 0,
      "outputPrice": 0,
      "voices": [
        { "label": "Alloy", "value": "alloy", "bufferId": "openai-Alloy" },
        { "label": "Echo", "value": "echo", "bufferId": "openai-Echo" },
        { "label": "Fable", "value": "fable", "bufferId": "openai-Fable" },
        { "label": "Onyx", "value": "onyx", "bufferId": "openai-Onyx" },
        { "label": "Nova", "value": "nova", "bufferId": "openai-Nova" },
        { "label": "Shimmer", "value": "shimmer", "bufferId": "openai-Shimmer" }
      ]
    }
  ],
  "whisperModel": {
    "model": "whisper-1",
    "name": "Whisper1",
    "inputPrice": 0,
    "outputPrice": 0
  }
}

好了，继续。开始配置：

修改docker-compose.yml：