使用Mi50 32G辅助RX6800加速AI推理Qwen3-32b

本文链接：https://blog.csdn.net/dwd112358/article/details/147654150

作为GCN架构的卡皇，MI50拥有32GB HBM显存显存，1TB/s带宽，非常吸引人，我也入手了一张，利用五一节的时间，终于搭好了平台环境，写下一些使用配置总结，能用上此卡，需要感谢前面各位大佬们踩坑留下的总结。

Windows 10环境下部署LM Studio和Qwen3-32b后，大概是15Tok/s，基本够用。

缺点

功能有限：Windows下不支持Rocm，只能使用Vulkan进行推理；
兼容性差：部分模型不支持，容易崩溃，好在Qwen3-32B支持；
噪声影响：原卡被动散热，需要改装涡轮风扇或水冷，涡轮有噪声，水冷有改装门槛；
前途暗淡：Ubuntu环境也只能安装Rocm6.2，Rocm6.4已经明确不支持MI50。

优点

显存带宽：提供大显存大带宽，运行32B模型刚好满足工作需求;
价格便宜：相对于显卡堪比黄金的N卡，32GB显存非常有优势；
兼容平台：兼容现有平台，非常适合，打游戏依然用RX6800，跑模型用MI50，完美适配；

准备工作

下载驱动:
Mi50的驱动需要专门下载驱动，参考MI50 32G装Windows驱动一步到位直接识别为MI60 ¹。
重要软件：
下载LM-Studio-0.3.15-11-x64.exe
下载python-3.13.0.exe
辅助软件：
下载风扇控制软件FanControl

安装驱动

先使用DDU卸载当前显卡驱动
关闭windows自动更新驱动
使用下载MI50-Software-Hybrid-25.3.1-R2.5-PolarisVegaNavi-Sophronia.zip驱动安装
主板BIOS，关闭CSM功能，开启Above4G
任务管理器能看到MI60 32G即安装驱动成功

风扇控制

使用FanControl进行风扇调节需要主板支持4Pin sysfan。
需要一个3D打印的带涡轮风扇的外壳，咸鱼大约50R，安装好后将风扇线接到主板的sysfan位置；

设置里切换成中文
使用FanControl扫描风扇和传感器；
创建图行风扇曲线，修改曲线名称，选择传感器；
找到显卡sysfan的编号，选择关闭手动模式，启用软件调节，选择创建的风扇配置曲线；

在这里插入图片描述

使用LM Studio部署模型

安装LM-Studio-0.3.15-11-x64.exe
安装 python-3.13.0.exe
建议安装在D盘
修改下载源，提升下载速度
打开CMD命令行，运行以下命令

pip install -U huggingface_hub

修改constants.py中_HF_DEFAULT_ENDPOINT宏定义，将下载站点从https://huggingface.co/ 修改为 https://hf-mirror.com
参考目录D:\Program Files\Python313\Lib\site-packages\huggingface_hub\constants.py

HUGGINGFACE_CO_URL_HOME = "https://huggingface.co/"
_staging_mode = _is_true(os.environ.get("HUGGINGFACE_CO_STAGING"))

# _HF_DEFAULT_ENDPOINT = "https://huggingface.co/"
_HF_DEFAULT_ENDPOINT = "https://hf-mirror.com"