仿真的硬件选型原则：CPU

最新推荐文章于 2024-07-17 11:19:36 发布

awayuk11

最新推荐文章于 2024-07-17 11:19:36 发布

阅读量1w

点赞数 10

分类专栏： General Notes on Simulation 文章标签： ansys 制造服务器硬件工程

本文链接：https://blog.csdn.net/weixin_44010204/article/details/125821615

版权

General Notes on Simulation 专栏收录该内容

28 篇文章

订阅专栏

做各类仿真工作，硬件条件是最基础的部分。如今主流仿真应用（结构有限元、流体CFD等）是基于CPU运行的，因此CPU的性能直接决定了仿真求解速度。本文就自身的理解，简单讲述CPU选型的几个基本原则。

1 架构与制程

基本原则：买新不买旧，一定要选发布时间较近的CPU，可以多考虑AMD的产品。

架构（architecture）是硬件的基本设计框架，直接决定了CPU的整体性能。和架构相关的另一个概念叫制程（fabrication process），表示了芯片内电路之间的间距。

通常而言，新架构会采用更先进制程，会比使用不那么先进制程的旧架构更优秀，因此可实现更强大的性能。制程则数字越低越好，例如7nm制程比14nm制程好。

近几年AMD和英特尔的架构、制程信息总结如下，格式：年份/架构名/制程/产品举例。规划中的产品线信息根据近期的新闻总结。

AMD：

2019 / Zen 2 / 7nm / Ryzen 9 3950X

2020 / Zen 3 / 7nm / Ryzen 9 5950X

2022 / Zen 4 / 5nm / Ryzen 9 7950X

规划中：2024 / Zen 5 / 3nm /

英特尔：

2020 / Comet Lake / 14nm / i9 - 10900

2021 / Rocket Lake / 14nm / i9 - 11900

2021 / Alder Lake / 10nm / i9 - 12900

2022 / Raptor Lake / 10nm / i9 - 13900

规划中：2024 / Meteor Lake / 7nm

2 核心数与频率

2.1 运行频率

对于同一架构的CPU，频率决定了单核心性能。CPU的频率包括基准频率和最大加速频率两类，其中，基准频率是指空载状态下的CPU频率，最大加速频率是指满载运行下可以实现的最大运行频率。频率要求为越高越好。

2.2 核心数和线程的关系

关于核心数问题，涉及核心线程的概念。利用超线程技术将一个CPU核心虚拟化为两个线程，可极大的方便操作系统进行硬件资源调度。但是超线程技术不会实际增加算力。操作系统分配CPU资源是按照线程进行分配，而不是核心。

类比举例，CPU算力资源是一大碗菜，每个需要CPU的程序是夹菜的人，超线程技术则将菜（CPU算力）均分为两小碗（一个核心虚拟化为两个线程），当多人吃菜（多个程序抢CPU资源）时，更容易将菜分配给每个吃菜的人（算力根据程序需求进行分配）。

在仿真软件的求解设置界面中，设置的调用核心数应该基于线程数，而非CPU核心数。应用程序不可能越过操作系统直接调度硬件资源。

任务管理器中显示的CPU信息如图，核心（cores）数量8，线程（logical processor）数量16。在仿真软件的求解计算设置界面中，调用核心数输入16才能使CPU满载运行；输入8只能使一半核心满载，一半核心空载。

2.3 核心数选型原则

核心数选择根据主要应用场景决定。所有程序都会出现核心数增加后并行效率恶化的趋势，因此无限制的增加CPU核心数并不能显著降低求解的时间。其恶化趋势如图所示。

对于并行加速效率较差的软件（例如各类基于有限元法的软件，包括ANSYS、Abaqus、HyperWorks、COMSOL等），可以考虑采用核心数中等，但是运行频率很高的型号，例如AMD线程撕裂者Pro 5965WX（24核心48线程，基准频率3.8GHz，最高加速频率4.5GHz）。由于程序本身的并行效率较差，因此进一步增加核心数量对于节约计算时间意义不大。

对于并行加速效率极佳的软件（例如基于有限体积法的Fluent、Star-CCM+，基于离散元法的EDEM等），可以考虑使用核心数更多的型号，至于单核心的频率则可以不要求太高，例如AMD线程撕裂者Pro 5995WX（64核心128线程）。

3 CPU类型

仿真的CPU主要采用桌面CPU或服务器CPU，很少见笔记本的移动端CPU。而且通常笔记本电脑无论硬件算力还是散热条件，都难以运行复杂的仿真项目。

对于同时代的CPU，因为实际上采用相同架构，因此两类CPU单核心的性能本身差异并不大。甚至部分服务器CPU因为可靠性需求而限制了频率，实际性能反而不如桌面CPU。服务器和桌面CPU，更多的差距在于两者在其他硬件的支持能力不同。部分服务器CPU型号支持多CPU扩展、大容量内存等，可适用于非常复杂的仿真问题。

3 CPU性能参考标准

CPU性能对比，可直接参考性能测试软件（performance benchmark software）的评分。整体而言，测试软件评分更高的CPU，其性能更强。不同性能测试软件的测试方法、打分标准等均不同，且侧重于不同的应用场景，因此需要参考多方性能测试数据做综合对比，且详细比较同一测试软件中不同项目的测试结果。

对于仿真应用，可推荐的测试程序：

Geekbench（官网：browser.geekbench.com）

PassMark（官网：www.cpubenchmark.net）

4 其他注意事项

4.1 电源系统搭配

电源如果供电功率不足或者供电质量太差（例如输出到主板的电压不稳定）会严重影响各设备的正常运行，甚至导致莫名其妙的死机等问题。电源输出功率要留有一定量余量，方便后续的硬件升级（如更换显卡、增加内存等）

4.2 散热系统搭配

良好的散热是硬件充分发挥性能的必备条件。散热不佳会导致系统通过降频甚至强制关机断电等办法保护硬件。如果安装空间等条件足够，建议使用水冷系统，可以承载更大的散热负荷。与此同时，散热系统需要定期做维护保养，包括清理内部积灰、加注导热硅脂等，建议对散热系统做维护频率至少一年一次。

4.3 软件问题

保持应用程序、操作系统、驱动程序、BIOS等软件部分的更新升级，使软件能够充分发挥硬件性能。特别是仿真软件本身，各个主要开发商均把提升并行效率，在更多核心数下可实现高效并行作为功能优化方向之一。

如果不存在VMWare之类必须开启超线程才能运行的程序，可建议将超线程在BIOS设置为关闭。关闭后，一个CPU核心等同于一个线程，因此实现同样的算力，可使用更少的核心数，提升并行效率。

关闭超线程提升并行效率的方法不适用于英特尔酷睿系列的12代及后续型号。原因在于，此方法的前提是每个CPU核心算力是相同的。酷睿系列的12代及后续型号采用大小核架构，仅大核（性能核）支持超线程，小核（效能核）不支持超线程，而且大核小核之间的算力差异巨大。