cuda第一次计算耗时_FLUENT计算与GPU加速

本文测试了CUDA在ANSYS FLUENT中的加速效果,发现GPU加速对耦合求解器计算效率提升显著,3060ti可达3倍,1080ti约为2倍。然而,对于分离式求解器,加速效果不明显,可能因网格数少,GPU加速优势被CPU-GPU交互时间抵消。FLUENT支持CUDA加速并能提高计算速度,但最佳线程数和GPU选择对效率有影响。
摘要由CSDN通过智能技术生成

太长不看版本,结论如下:

1. FLUENT中,GPU加速对于耦合求解器计算十分明显,3060ti能够提高计算效率约3倍,1080ti能够提高计算效率约2倍;

2. FLUENT中,GPU加速对于分离式求解器效果不明显,这可能是由于网格数太少,GPU对线性系统加速节约的时间,和CPU与GPU之间信息交互额外耗时差不多相抵消,求解系统越庞大,GPU加速才会明显;

3. 分离式求解器是默认关闭GPU加速,需要通TUI命令开启,同时仅建议只对压力方程求解开启GPU加速;

4. FLUENT中,不同线程数对计算影响较大,对CPU主频反而敏感。


针对科学计算的GPU加速技术在过去十多年里得到巨大发展,其主要依赖于GPU性能的提升。过去,如果要搞深度学习,或者数值计算系统求解的GPU加速,通常只能使用专用计算卡,包括Quadro系列、Tesla系列等。然而,随着皮衣刀客黄仁勋发布30系显卡,旗舰卡3090有着比TITAN更高的性价比,过去“四路泰坦抱回家”的梗总算能改成“3090抱回家”了。GPU加速不在依赖于高端计算卡,即便是30系的甜品卡3060ti也有着4864个cuda核心,昔日卡皇2080ti仅有4352个cuda核心,而上上代老卡皇1080ti只有3584个cuda核心。几年前,仅1080ti显卡就要近一万元,今天,花1/3的价钱就能买一张

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值