挑战纯CPU最低成本推理极限:四路E5服务器装机与模型优化(持续探索优化中)

前情提示

本贴属于个人探索帖, 后续用到的一些模型推理项目也大都处于测试开发阶段, 模型可能会出现无法载入或者运行不稳定等各种兼容性问题, 如果是为了想低价玩模型的纯小白, 不建议仿照, 如果有大佬知道优化思路的, 也欢迎一起探讨, 当然真想入手可以考虑单纯入手一块四路x99的主板放家里备着, 价格几百也不算太贵, 将来对于纯CPU并行优化好了, 可以再采购其他材料装机直接玩, 因为现在二手市场上的正牌的四路主板货还是很稀缺的, 特别是支持e5 v3以上的, 不是便宜不便宜买到的问题, 是难不难买到的问题, 我为了买这台机器的主板就在咸鱼和各老板博弈了将近一个星期. 本贴也不会涉及过多的理论科普, 主要展示实际中的应用.

当前配置成本

RQ750主板 + 原装电源 1250元
内存DDR4 2133 x16 128G 16x40=640元
E5-4650 v3 * 4 20x4=80元
硬盘散热机箱等各类杂项 500元左右

当前整台机器成本在2500元左右, 本机48核心96线程, 最大理论内存16通道带宽是272GB/s, 加上128G的RAM容量, 理论上跑一个70B Q8会有3~4t/s的速度, 并且考虑的以后会有越来越多的大体积优秀moe架构的模型推出,性能高的同时推理速度还不低,对于CPU+内存方案是很吃香的,我也是在向着无限接近理论性能不断寻求优化方案, 因为怕翻车因此只买了这么多内存.

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值