AIGC - Qwen大模型:Qwen-7B模型推理部署

硬件环境

作为AIGC方面的小白来说,我抱着非常天真的想法,想让它在我的工作笔记本上用i5的CPU去跑,至于为什么这么想,当然是因为我没有GPU,身边也没有其他的带显卡电脑

恰好,在腾讯云看到了GN7的显示优惠活动,60块钱15天,Nvidia T4的AI卡,直接斥巨资购买了15天;不过这段时间准备搭一台自己用的服务器,初步计划是可以插4块GPU,内存上到200G,还是用DeepSpeed做下全量训练啥的。

软件环境

腾讯云的服务器,我选择了自己常用ubuntu镜像,同时此模型都是基于python语言,pytorch框架训练的模型,为了便于管理python版本库,使用anaconda来管理。

具体软件环境版本如下:

        conda 4.8.2

        python 3.9

        pytorch2.0.1

        cuda 11.7

具体的软件环境搭建过程,另起一篇去记录

模型部署使用

  1. 安装依赖环境

克隆github库:git clone https://github.com/QwenLM/Qwen.git

pip install -r requirements.txt

安装时,与其他模型要求的transformers库版本冲突,由于选择的conda环境不对,切换到之前创建的langchain环境 conda acitivate langchain

  1. 设置模型文件路径

此环境最大GPU显存为16GB,但跑7B模型的FP16需要20几个G,所以这里跑量化后的模型INT4版本的

运行cli_demo.py

python cli_demo.py

此DEMO还融合了使用GPT回答相关问题,所以需要安装GPT相应依赖库

pip install optimum auto-gptq

通过此方式从huggingface下载的模型文件会以缓存的形式存放在如下目录

### Ubuntu 上安装和配置 Ollama Qwen #### 下载并安装 Ollama 对于希望在 Ubuntu 系统上部署 Ollama 的用户来说,可以通过命令行快速完成安装过程。具体操作如下: ```bash curl -fsSL https://ollama.com/install.sh | sh ``` 这条指令会自动下载最新的安装脚本并且执行它来安装 Ollama[^1]。 #### 配置环境变量 为了使 Ollama 能够正常工作,在某些情况下可能需要设置特定的环境变量。例如,可以使用 `launchctl` 来设定全局可用的环境变量: ```bash launchctl setenv OLLAMA_HOST "0.0.0.0" ``` 这一步骤有助于指定服务监听地址以便更好地控制访问权限[^4]。 #### 添加 Open Web UI 支持 如果想要增强用户体验,还可以考虑集成 Open Web UI 功能到 Ollama 中去。虽然具体的实现细节未在此提及,但是通常涉及修改配置文件或是利用额外插件/扩展的方式来进行添加。 #### 处理大型模型文件 当涉及到像 Qwen 这样的复杂 AI 模型时,由于其体积较大,初次加载可能会花费较长时间。因此建议保持网络连接稳定,并给予足够的时间让系统完成资源获取。完成后可通过以下命令确认模型状态: ```bash ollama list ``` 此命令用于展示当前已经成功拉取下来的各个模型列表及其相关信息[^3]。 #### 解决启动问题 针对提到的关于不同 shell 启动失败的情况(如 PowerShell 可以而 Bash 不行),这类现象往往是因为路径差异或者是依赖项缺失所引起的。确保所有必要的 Python 库都已经正确安装是非常重要的。比如,如果是基于 LangChain-Chatchat 构建的应用,则应该先运行下面这个 pip 命令来更新或安装所需的软件包: ```bash pip install langchain-chatchat -U ``` 此外,还需注意检查是否有其他潜在因素影响到了程序的正常启动,例如防火墙规则、端口冲突等[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

有意思科技

给与不给,我都会更新

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值