计算化学/计算流体力学/计算生物学装机选购指南

Precaution

  1. 本文建议仅供参考,每个人的需求不同,有不同的选择是正常的。
  2. 本文所推荐的装机配置并不适合所有人,包括但不限于游戏玩家、平面设计师、视频剪辑师等群体,仅适合没有特别多经费、又高性能计算需求的用户,如大学内小型实验室、个人学习、小公司等。
  3. 装机难度较高,笔者仍然建议在装机前做好充分调研,包括但不限于认真学习主板操作手册、去相关科研论坛交流装机经验、观看国外博主做的装机视频(HPC相关的装机国内相关可参考的视频资料较少)、具有基础的计算机组成原理知识等。
  4. 本文内容可能具有时效性。

Introduction

很多大学的中小型实验室,一些个人的工作室以及一些有个人学习需求的硕士生、博士生,都希望能够有一台计算性能强、性价比高、具有可拓展性、且维护方便的计算主机。出于经费的考量,据笔者了解,有很多单位在采购计算主机其实由于费用较高,往往必须通过招标的方式来进行。得到的机子往往具有财务审批流程冗杂、机型比较老等问题。对此,本文旨在给出一些可参考的建议,对于那些经费不足,但仍希望进行科研工作的读者,一些入门的选购建议。

笔者参观的某单位,有一台2017年采购的惠普Z8,据说当年卖6万多块。

而由于时过境迁,这台老机子的CPU现在连12代i5都不一定打得过了。

数据来源: PassMark Intel vs AMD CPU Benchmarks - High End

品牌机有品牌机的好处,具体如下:

  1. 保修比较容易,这些大厂的维修点多、配件好更换。
  2. 各个配件的兼容性比较好,操作说明书比较全面。不像自己装机,各个配件的兼容性有的时候出问题难以自己解决。
  3. 由于是一体式设计,所以散热风道设计比较好,自己装机可能会出现机箱内热空气扰流,散热效率低等问题。
  4. 可以开对公发票,好报销。

自装机有自装机的好处,具体如下:

  1. 性价比高。可以捡洋垃圾CPU,淘二手服务器等。
  2. 自定义性强。可以针对自己的计算需求挑选合适的处理器。比如你有CFD计算流体力学的需求,那多核心的EPYC系列可能更适合你,如果求单核性能,那至强W系列、线程撕裂者更合适。
  3. 方便自己给机器debug(自己装的机当然容易排查故障)。
  4. 不用去做采购招标。

现在进入正题。

CPU的选购

EPYC系列

EPYC是AMD面向服务器端的cpu,比较适合捡洋垃圾,淘宝、拼多多低价的比较多。突出的优点有:

  1. 核心很多。很容易做到64核心128线程,比如EPYC 7B12以5400的价格就能买到2.25G 64核 128线程。EPYC 9754更是达到丧心病狂的128核心256线程。
  2. 三级缓存特别大。比如7B12就有256MB的L3 Cache,这使得一些小程序可以直接放入缓存中执行,EPYC 9684X的三级缓存因为用了3D堆叠技术,三缓更是达到了逆天的1.1GB(当然价格也很逆天)。
  3. 支持ECC内存,这其实是服务器内存的标配,ECC内存可以给数据进行纠错,有效防止系统崩溃几率。
  4. PCIE通道特别多,EPYC 9684X有128条PCIE5.0 通道,以至于很多EPYC主板甚至都没有配南桥芯片,因为可以直接PCIE通道拿数据,为何要走南桥?
  5. 体质好,据说服务器芯片都是晶元上最好的部分切下来的,不像某厂i9 14900K,体制属于是赛博赌石了。
  6. 主频低(可能也是缺点?),整体运行比较稳定。
  7. 支持一些可以用于深度学习加速的指令集,如AVX512。
  8. 主板可以选配服务器主板,用IPMI远程管理很香。

缺点当然也很多:

  1. 很多软件对多核心处理器优化不够好,“一核有难十核围观”的情况比较多。
  2. 主频很低,且没有什么超频空间(当然我听说在b站上有些人通过魔改BIOS实现对EPYC超频,但这种情况一般不推荐,稳定性很差,容易蓝屏)。
  3. 服务器主板和消费级主板功能差距比较大,包括但不限于:尺寸不一样导致机箱选择比较少(如SSI-EEB板型)、螺丝孔位和ATX规格不太一样、主板需要各种特别设置才能完整发挥CPU性能(包括划分NUMA节点)、只有VGA输出接口(多说一句,这个VGA接口的视频数据是不能通过HDMI转换器输出给显示器的,想不买VGA显示器只能用采集卡输出到笔记本屏幕)、Debug比较困难学习曲线比较陡峭等
  4. 不太好配水冷,淘宝上给EPYC做水冷的牌子基本上都是小厂子,不过也难怪,这种CPU一般都在数据中心机房里享受上好的冷空调和万转暴力的散热风扇。
  5. 没什么装机经验帖子可以参考,遇到困难只能自己debug。

目前EPYC系列分为4代,他们分别是:First generation Epyc (Naples那不勒斯) · Second generation Epyc (Rome罗马) · Third generation Epyc (Milan米兰) · Fourth generation Epyc (Genoa热那亚 Bergamo and Siena)都是以意大利地名命名。

EPYC处理器的命名规则见下图:

第一位数代表系列,比如第一代就是EPYC 7001系列,比如EPYC 7251,第二代也是7系列,7002series,第三代就是7003系列,他们都是SP3插槽,而第四代就是9004系列了,用SP5插槽。

第二和第三位数代表核心和性能,具体可以参考图片。

第四位数就是哪一代,7001系列就是第一代,7002就是第二代,7003就是第三代,9004就是第四代。

第五位是一些特殊型号,比如P就是只能组单路CPU,X就是有3D缓存技术,L3 Cache很大。

一般选购有如下规则:

  1. 不要选第一代7001系列,发布于2017年,7年前的老U了,而且电子产品一般不买第一代。
  2. 02和03差距其实没那么大,EPYC 7B12和7B13差不多差1300,加点钱升第三代也行。
  3. 第四代因为是最新一代,溢价比较高,比如EPYC 9124售价快一万,性能总体跑分还不如2000多的14代i7。

  4. 48核心和32核心的性价比比较高,当然也有EPYC 7282不到500块的16核心洋垃圾,性能还不如i3。
  5. 尽量不要买跑分低于i7的U。

EPYC总体性价比很高,但是还是需要看清需求再购买。

Xeon scalable系列

具体命名规则看这图,链接:英特尔处理器命名规则icon-default.png?t=N7T8https://www.intel.com/content/www/us/en/support/articles/000059657/processors/intel-xeon-processors.html

 

第一位8或9代表是至强铂金系列,最牛逼;6、5是至强金牌;4是至强银牌;3是铜牌。

第二位是代系,1234分别对应1234代。

第三位和第四位是SKU型号。

SKU stands for "stock keeping unit", and it's a unique code that sellers assign to each item they sell. SKUs are a vital tool for retailers and wholesalers to track inventory and monitor stock levels. They also allow merchants to arrange inventory in their stores or warehouses according to product SKUs.

有意思是的是,你在淘宝上经常会看到一些查不到型号的至强U,比如Xeon 8330C,这类U都是OEM定制的,比如给阿里云定制的U,专门为云计算、数据库等特别场景优化。

OEM stands for original equipment manufacturer, which is a company that makes parts or equipment for another company to market. For example, a computer manufacturer might buy microprocessors and operating systems (OS) from an OEM company, and then sell the computer under their own brand name.

总的来说至强U比EPYC性价比要低一些,大部分人都会选择EPYC,但是英特尔这么多年技术底蕴和软件生态在这里,比如matlab很多函数对英特尔的CPU就有专门的优化。

线程撕裂者系列

线程撕裂者总体来说可选的范围比较窄,而且cpu总体来讲比较贵,市面上最便宜的Threadripper 3960X也要接近5000左右,性能还不如13代i9。

线程撕裂者总体来讲价位分布比较不均匀,不像EPYC系列几乎2000-30000各个价位几乎都有SKU,优点是主频比较高。但其实EPYC和线程撕裂者其实是一脉相承的,比如EPYC 9654和Threadripper Pro 7995WX(数据来源:极客湾)。

图片来源:极客湾

总体来讲如果不缺钱,直接上最新一代Threadripper 7000系列或者Threadripper Pro 7000WX系列(起售价15000,而且主板也不便宜)。

目前市面上主要是3000系列,5000系列,和7000系列。

感觉性价比一般,不详细介绍。

主板的挑选

EPYC系列主要就是选超微H11、H12、H13系列

  • H11系列支持7001、7002系列
  • H12系列支持7002、7003系列
  • H13支持7004系列
  • 当然技嘉、泰安主板很多也可以选,买戴尔R7515这种机架式一体机也行,超微的板子主要是用的人多,我看国内外写相关教程、拍装机视频、写装机经验贴的人也比较多。

    SSL、SSW、DSI这种尾号一般就是指单路或者双路CPU,SSL就是单路CPU,DSI就是双路CPU。尾缀带NT的基本上就是千兆网卡和万兆网课,以及SATA拓展性等区别,具体可以搜索查询。

    至强系列这方面就多了,比如华硕的WS C621E SAGE

    价格5000左右,支持4路SLI/交火,适用第一代、第二代Xeon scalable系列。

    第三代的话,我推荐这款:

    超微X12DPI,还支持傲腾内存(可怜的傲腾被扫进了历史的故纸堆里)

    内存的选购

    服务器内存和普通游戏主板用的内存不太一样,普通的台式机用的大部分是U-DIMM类型的内存,U即unbuffer,与之对应的是R-DIMM,R就是Register,带寄存器缓存,所以叫RECC也比较多

    更高级的还有LRDIMM和 3DS DIMM,前者指Load Reduce DIMM,后者采用了3D堆叠技术,两者容量都比普通UDIMM和RDIMM都要大。

    要注意主板的兼容性,有些主板有单通道RDIMM容量大小限制。

    那个2S4R是Two ranks of dual die packaged DRAM的意思,具体要懂点内存的基本结构,这个是题外话。

    小结

    本文介绍了高性能计算主机CPU和主板选购的一些经验,受篇幅限制,后续可能会补充内容,先写到这里。

  • 34
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值