跳到主要内容

ANSYS的博客

2022年2月25日

释放多个gpu的CFD模拟能力

计算流体动力学(CFD)工程师对加速他们的模拟吞吐量非常感兴趣,无论是通过自动化工作流程,升级到更新/更好的方法,还是使用高性能计算(HPC)

一个特别有趣的主题是CFD中图形处理单元(gpu)的使用。这并不是一个新概念,但有很多方法可以实现它——有些方法比其他方法更完整。例如,近年来,CFD社区已经看到许多基于颗粒的CFD方法使用gpu。

在连续体Navier-Stokes领域,使用gpu作为CFD加速器的概念已经存在多年;以NVIDIA的AmgX求解器为例,它已经在Ansys流利自2014年以来。你得到的局部加速是非常依赖于问题的,最后,未针对gpu优化的部分代码将限制你的整体加速。为CFD释放GPU的全部潜力需要整个代码驻留在GPU上运行。

Ansys一直是使用GPU技术进行仿真的先驱,今年我们将在Fluent中引入Ansys多GPU求解器,将其提升到一个全新的水平。

让我们来看看跑步的好处CFD模拟以及何时应该考虑在模拟中使用该选项。

为什么使用gpu进行CFD模拟?

近年来,我们看到GPU硬件和专用编程语言的发展取得了巨大飞跃,这些语言帮助开发人员构建CFD求解器,相当于为传统cpu设计的求解器,但将其模块移植到GPU上。

使用gpu进行CFD模拟的主要好处是:

  • 增加性能。正如我们的基准测试所示,单个GPU可以提供与400多个cpu相同的性能。如果这听起来很棒,那么在多个gpu上运行会变得更好:六个gpu可以与2000多个cpu一样强大!
  • 降低硬件成本。GPU服务器的成本明显低于同等性能的CPU集群的成本。这为CFD模拟的高性能计算民主化打开了大门!
  • 降低功耗。电力成本也是许多公司运行模拟的一个重要方面高性能计算集群。gpu有助于显著降低成本,从而在考虑所有成本时提高其模拟投资回报率(ROI)。

cpu与gpu:比较CFD模拟性能

对新的多gpu求解器的性能感到好奇吗?观看下面的视频,听听英伟达在11月的GTC 2021上说了什么。

让我们深入了解汽车外部空气动力学基准。我们已经看到,单个NVIDIA A100 GPU的性能比具有80核Intel®Xeon®Platinum 8380的集群高出5倍以上。

空气动力学仿真运行在CPU和GPU上

图1:CPU求解器(左)和GPU求解器(右)上的汽车空气动力学

cpu和gpu的求解次数和功耗比较

图2:不同CPU集群和GPU服务器配置的加速

1 NVIDIA A100 GPU > 400 Intel®至强®铂金8380芯

同样,在航空航天外部空气动力学基准测试中,我们已经看到单个NVIDIA A100 GPU的性能是拥有32个Intel®Xeon®Gold 6242内核的集群的8.5倍以上。

航空航天空气动力学模拟的例子

图3:基于GPU求解器的航空航天空气动力学

图表显示cpu和gpu之间的速度差异

图4:不同配置的CPU集群和GPU服务器的加速

1 NVIDIA A100 GPU≈272 Intel®至强®6242金芯

gpu如何降低硬件成本?

在这些基准测试中,我们不仅评估了gpu和cpu的性能,而且还考虑了在做出硬件购买决策时重要的其他方面。我们着眼于硬件成本,将GPU服务器的成本与具有同等性能的HPC集群的成本进行比较。

图表显示gpu与cpu的硬件成本

图5:CPU集群和同等GPU服务器的硬件成本

该研究证明,在给定目标性能的情况下,在gpu上运行CFD模拟的工程师可以将硬件成本降低7倍。

硬件采购成本降低7倍

这个结果很重要,不仅对于那些已经利用HPC来加速其模拟吞吐量的公司,而且对于那些负担不起HPC集群成本并且目前正在影响其上市时间的公司。

能够在更便宜的硬件上运行,具有更好的性价比,这将使工程师能够提升他们的模拟能力,同时保持在他们预算的总拥有成本之内。

由于采用gpu进行CFD模拟可以节省硬件成本,因此公司可以在几年内收回软件投资。

gpu如何降低功耗?

公司做出硬件购买决策的另一个重要方面是维护和操作HPC集群所需的能力。

我们研究了1024个Intel CPU集群的功耗®至强®黄金6242核,并指出功耗为9600瓦。当我们观察提供相同性能的6 × NVIDIA®V100 GPU服务器的功耗时,功耗降低到2400 W。

我们的基准测试结果证明,与同等HPC集群相比,选择6倍NVIDIA®V100 GPU服务器的公司可以将其功耗降低四倍。

cpu和gpu的求解次数和功耗比较

图6:CPU集群和同等GPU服务器的功耗

功耗降低4倍

在Fluent中展示新的Ansys多gpu求解器

借助Ansys 2022 R1,客户可以在一个或多个gpu上利用Fluent中的新的多gpu求解器进行不可压缩和可压缩流,以及稳态或瞬态模拟。这个新的求解器从头开始设计,在gpu上本地运行,并充分利用它们的潜力。这与其他仿真厂商提供的独立软件模块的GPU加速有着根本的不同。

这个新的求解器支持所有网格类型(例如,多边形,六边形,tet,金字塔,棱镜,悬挂节点),并可用于所有亚音速可压缩流与恒定的材料属性。它还支持常见的湍流模型以及固体传导,共轭传热,移动壁和多孔介质。

赛车运动空气动力学的CFD模拟

图7:使用Ansys Fluent多gpu求解器的f1空气动力学

你是在处理外部空气动力学,内部流动,还是传热模拟?如果是这样,您可能希望了解更多有关如何从启用gpu的模拟中获益的信息。

正如您所猜到的,这只是我们gpu支持的CFD模拟之旅的开始。Ansys计划与我们的GPU硬件合作伙伴合作,在未来的版本中扩展对其他功能和工业应用的支持。

如果您想了解更多关于Ansys Multi-GPU求解器的信息,请查看我们的Ansys Fluent 2022 R1发布更新,或联系您的Ansys代表获取更多信息。

看看Ansys可以为您做什么

今天就联系我们

* =必填项

谢谢你的联系!

我们在这里回答你的问题,期待与你交谈。我们Ansys销售团队的一名成员将很快与您联系。

页脚的形象