你知道GPU对Ansys Fluent仿真有多重要吗?

多年来,加速 CFD 模拟的关键推动力之一是高性能计算 (HPC),并且近年来已扩展到图形处理单元 (GPU)。

在 CFD 世界中利用 GPU 并不是一个新概念。GPU 被用作 CFD 加速器已经有一段时间了。但是,您获得的局部加速度取决于问题。最后,未针对 GPU 优化的代码部分会限制您的整体加速。这就是为什么我们想向您展示当 CFD 模拟在多个 GPU 上本地运行时 GPU 的潜力。

本文将展示 GPU 如何帮助减少仿真时间、硬件成本和功耗。在第一部分中,我们将介绍一些层流和湍流问题。随着系列的进展,所讨论的物理建模能力也将如此。

汽车外部空气动力学加速32倍

对于我们的第一个示例,让我们看一下汽车外部空气动力学模拟,它可以很快变得非常大——通常超过 3 亿个单元。运行这种规模的模拟需要数千个内核和数天(有时甚至数周)的计算时间。如果有一种方法可以将模拟时间从几周缩短到几天或几天缩短到几小时,同时还能显着降低功耗呢?剧透警告:有,那就是完全在 GPU 上运行这些模拟。

可持续性是汽车行业的一个关键问题,世界各地的政府机构都在制定严格的规定。汽车公司一直在评估是否符合或超过这些规定的一些领域包括:

  • 改善空气动力学
  • 减少排放
  • 使用替代燃料
  • 开发混合动力和电动动力系统选项

但可持续发展的努力不应仅限于最终产品(在本例中为汽车)的运营——这种努力也应扩展到产品的设计过程。这包括仿真,我们 Ansys 希望减少仿真过程中的功耗。

完全在 GPU 上运行可以加速汽车外部空气动力学模拟

对于所示的模拟,我们使用 Fluent 在不同的 CPU 和 GPU 配置上运行基准 DrivAer 模型并比较了性能。我们的结果表明,单个 NVIDIA A100 GPU 的性能比具有 80 个英特尔® 至强® 铂金 8380 内核的集群高 5 倍以上。当扩展到 8 个 NVIDIA A100 GPU 时,模拟速度可以提高 30 倍以上。

利用 GPU 加速汽车外部空气动力学仿真

在更短的时间内获得结果使我们的客户更有效率,但它并不止于此:我们还可以通过大幅降低运行此类模拟所需的电力来减少他们的电费(并帮助地球!)。

我们查看了具有 1024 个 Intel® Xeon® Gold 6242 内核的 CPU 集群的功耗,并注意到功耗为 9600 W。与提供相同性能的 6 x NVIDIA® V100 GPU 服务器的功耗相比,该功耗消耗降低了四倍,降至 2400 W。

这些基准测试结果表明,与同等 HPC 集群相比,选择 6 x NVIDIA® V100 GPU 服务器的公司可以将其功耗降低 4 倍,这甚至不考虑为保持服务器机房凉爽而降低的冷却成本。

使用 GPU 服务器时的功耗降低

在原生 GPU 求解器上运行模拟可以对您公司的可持续发展工作和减少您等待结果所花费的时间产生巨大而直接的影响。不仅仅是任何结果——这些都是您可以信任的结果。在过去的 40 多年中,Fluent 已在各种应用中得到广泛验证,并以其行业领先的准确性而闻名。Fluent 中可用的 CPU 和多 GPU 求解器都建立在相同的离散化和数值方法上,为用户提供几乎相同的结果。

下面的两个典型案例是完善的 CFD 验证,它们模拟了层流和湍流状态的基本原理。这两种情况都详细说明了用户在 GPU 上本地求解时将获得的准确度。

球体上的层流

文献中充斥着关于球体流动的实验和数值研究,可作为外部空气动力学验证的基本基准。对于第一个测试,我们选择了雷诺数等于 100 的层流条件,并且预计流体会绕过球体并在圆柱体后面形成时不变的涡流结构。文献中提出的阻力相关性用于将 CFD 结果与实验数据进行比较。

球基准上层流的速度流线和压力分布

如表 1 所示,原生 GPU 实现计算风阻系数非常准确,误差百分比仅为 -0.252%。

表 1. 阻力系数 (Cd) 比较

后向台阶

后向台阶是用于测试湍流模型实现的典型问题。看似简单的配置却蕴含着丰富的物理特性。对于该测试,我们重新创建了 Vogel 和 Eaton 2的实验装置,其入口速度为 2.3176 m/s。通过将沿通道长度的不同平面的速度剖面与已发布的实验数据进行比较,对 CFD 代码进行了测试。

后向步骤的速度向量

在 CPU 上解决时,Fluent显示与实验结果3,4良好的验证。使用原生多 GPU 求解器解决相同的问题为用户提供了几乎相同的结果,如下所示,因为 Fluent 中可用的 CPU 和 GPU 求解器都是基于相同的离散化和数值方法构建的。

在 CPU 和 GPU 上求解后向步骤的速度曲线结果

这种接受所有网格类型的非结构化、有限体积 Navier-Stokes 求解器的原生多 GPU 实现确实是新颖的,并设置了一个新的CFD 标准, 不妥协准确性。

仿真模拟高性能计算推荐赞奇云工作站

现在的专业软件都是越做越大,功能成倍成倍地增加,而处理的对象也是越来越复杂,特别是使用一些仿真软件在高精度下建模仿真的时候,因为PC上硬件的发展速度慢于软件功能复杂化的速度,就造成了我们的仿真看起来是越跑越慢了。

这种情况下还是推荐选择赞奇超高清云工作站来运行仿真,对比传统的电脑可以省去随着软件更新迭代也要升级硬件的麻烦,在赞奇云工作站云端配置实时更新,而且一键申请可随时更换配置机型,按需使用,高效运算,不再担心本地电脑运行慢卡顿等问题。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值