使用Mi50 32G辅助RX6800加速AI推理Qwen3-32b

作为GCN架构的卡皇,MI50拥有32GB HBM显存显存,1TB/s带宽,非常吸引人,我也入手了一张,利用五一节的时间,终于搭好了平台环境,写下一些使用配置总结,能用上此卡,需要感谢前面各位大佬们踩坑留下的总结。

Windows 10环境下部署LM Studio和Qwen3-32b后,大概是15Tok/s,基本够用。

缺点

  • 功能有限:Windows下不支持Rocm,只能使用Vulkan进行推理;
  • 兼容性差:部分模型不支持,容易崩溃,好在Qwen3-32B支持;
  • 噪声影响:原卡被动散热,需要改装涡轮风扇或水冷,涡轮有噪声,水冷有改装门槛;
  • 前途暗淡:Ubuntu环境也只能安装Rocm6.2,Rocm6.4已经明确不支持MI50。

优点

  • 显存带宽:提供大显存大带宽,运行32B模型刚好满足工作需求;
  • 价格便宜:相对于显卡堪比黄金的N卡,32GB显存非常有优势;
  • 兼容平台:兼容现有平台,非常适合,打游戏依然用RX6800,跑模型用MI50,完美适配;

准备工作


安装驱动

  1. 先使用DDU卸载当前显卡驱动
  2. 关闭windows自动更新驱动
  3. 使用下载MI50-Software-Hybrid-25.3.1-R2.5-PolarisVegaNavi-Sophronia.zip驱动安装
  4. 主板BIOS,关闭CSM功能,开启Above4G
  5. 任务管理器能看到MI60 32G即安装驱动成功
    在这里插入图片描述

风扇控制

使用FanControl进行风扇调节需要主板支持4Pin sysfan。
需要一个3D打印的带涡轮风扇的外壳,咸鱼大约50R,安装好后将风扇线接到主板的sysfan位置;

  1. 设置里切换成中文
  2. 使用FanControl扫描风扇和传感器;
  3. 创建图行风扇曲线,修改曲线名称,选择传感器;
  4. 找到显卡sysfan的编号,选择关闭手动模式,启用软件调节,选择创建的风扇配置曲线;

在这里插入图片描述


使用LM Studio部署模型

  1. 安装LM-Studio-0.3.15-11-x64.exe

  2. 安装 python-3.13.0.exe
    建议安装在D盘

  3. 修改下载源,提升下载速度
    打开CMD命令行,运行以下命令

pip install -U huggingface_hub

修改constants.py中_HF_DEFAULT_ENDPOINT宏定义,将下载站点从https://huggingface.co/ 修改为 https://hf-mirror.com
参考目录D:\Program Files\Python313\Lib\site-packages\huggingface_hub\constants.py

HUGGINGFACE_CO_URL_HOME = "https://huggingface.co/"
_staging_mode = _is_true(os.environ.get("HUGGINGFACE_CO_STAGING"))

# _HF_DEFAULT_ENDPOINT = "https://huggingface.co/"
_HF_DEFAULT_ENDPOINT = "https://hf-mirror.com"
  1. 重启LM Studio后,即可选择模型下载使用

  2. 运行API服务,右键右下角lm studio图标,点击Start Server启动服务
    在这里插入图片描述


使用VS Code 的Continue插件访问模型

  1. 安装Continue插件,使用切换到pre-release预发布版

  2. 添加模型
    Provider选择LM Studio,Model选自动侦测,点击Connect创建配置
    在这里插入图片描述

  3. 选择模型,正常使用Continue插件处理代码


  1. 黑洞没那么黑-MI50 32G装Windows驱动一步到位 直接识别为MI60 ↩︎

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值