跳转至主要内容

Ansys优势杂志

日期:2019年

早期模拟避免芯片烧毁

作者:王亚东,美国圣地亚哥高通公司工程师

热约束性能是GPU设计的一个挑战。利用Ansys PowerArtist在芯片设计过程的早期(RTL设计期间)执行独特的差分能量分析,高通工程师能够识别和修复GPU中的冗余切换,从而将关键设计块的电源效率提高10%。

“高通在设计流程早期使用Ansys PowerArtist进行差分能量分析,每瓦性能提高了10%。”

智能手机和平板电脑制造商不断改变设计,寻找比竞争对手的产品更有优势的地方。每款新机型都能做得更多、更快、电池续航时间更长。与此同时,应用程序和后台功能消耗的电量越来越大。

移动技术领域的全球领导者高通(Qualcomm)的工程师们一直在探索提高移动设备中半导体组件性能的方法。特别是图形处理单元(GPU),是游戏等消费应用程序的关键组件。想象一个消费者在手机上玩视频游戏。GPU运行速度越快,游戏时间越长,GPU耗电越多,导致手机温度升高。在某些时候,手机会自动降低时钟速度(在合理的范围内),通过降低功耗来冷却自己。但这会导致游戏速度变慢。虽然很烦人,但这些减速是手机设计的一部分。这种热约束性能正在成为GPU设计中的一个关键性能指标。

高通不只是忍受这些放缓,而是正在采取行动。在开发过程的早期,即确定微架构时的寄存器传输级(RTL),使用Ansys PowerArtist模拟对gpu进行差分能量分析,优化gpu的电源效率并保持设备温度较低。

使用PowerArtist进行低功耗RTL设计的七个步骤


“Ansys PowerArtist可以在几个小时内分析真实世界的用例,这比标准方法快几个数量级。”

早期RTL功率分析

高通在RTL会议上选择Ansys PowerArtist进行功率分析和缩减,因为其评估功率的方法非常现实。例如,传统的功率分析仅在几微秒内对设计活动进行采样,这段时间太短,无法提供真实的快照。相反,Ansys PowerArtist分析现实世界的用例(如高清视频帧),在几个小时内创建功率配置文件,这比标准方法快几个数量级。除了功率配置,它还允许工程师通过对设计实现效果(如时钟树)的独特建模,在RTL可靠地为设计的不同部分预算功率。它支持通过可量化的度量、假设功率趋势分析、跟踪问题根源的电源调试以及功率回归(当一个看似很小的修复突然导致其他地方的功率激增时非常有用)来进行电源效率分析。

查看大图

基于rtl的电源效率可以实现早期可靠的设计决策。


微分能量分析

在追求功耗优化设计的过程中,高通设计团队首先通过工艺选择和电源岛最小化功耗泄漏。接下来,他们专注于最小化冗余开关活动,以找到动态节能。他们采用了一种巧妙的方法来完成这项任务:他们没有直接在GPU中寻找冗余切换——这是一个耗时、乏味的过程——而是通过模拟相同GPU以不同速度运行来比较两个版本的GPU。例如,通过添加延迟来模拟饥饿或失速,来模拟较慢的速度。如果最初的设计是最优的时钟门控,那么两个运行的网络切换数量应该是相同的,并且两个运行的总能量应该是相同的。然而,如果在原始设计中存在任何门控效率低下的情况,那么在较慢的运行中,设计中的冗余开关将在较长时间内处于活跃状态,因此该运行中的集成能量将高于原始运行。


对于较慢的向量,较高的能量暴露了冗余活动。

微分能量和功率分析的独特方法


“在开发过程的早期,在寄存器传输级(RTL)进行差分能量分析,可以优化gpu的效率,并保持移动设备的温度较低。”

定位冗余活动

在发现较慢运行时的综合能量更高,表明存在门控效率低下后,高通工程师在动态功率分析方面进一步进行了分析。注意到PowerArtist在每个级别分离了开关和内部能量贡献,除了总能量之外,他们能够精确定位冗余活动的位置。

内能是在寄存器等门内耗散的能量,而开关能是与门之间的互连相关的能量。在较慢的模拟运行中,寄存器上的冗余数据输入或输出切换将导致开关和内部能量的增加,而时钟输入上的冗余切换只会增加内部能量。有四种可能的转换场景可以帮助确定冗余。


通过研究四种情况,系统方法确定了冗余寄存器引脚切换。


如果内部组件或开关组件没有差异,则优化是理想的。在其他情况下,很容易确定哪里必须有冗余活动。这些包括:

  1. 当数据稳定时,时钟引脚上的额外开关
  2. 时钟关闭时,D/Q引脚上的额外开关
  3. D/Q引脚和时钟引脚上的额外开关


一个重要的效率提升

使用这种新颖的差分能量分析方法,高通工程师深入寻找候选块,进行更详细的分析,包括修复可能产生重大影响的单个寄存器。进行这些初始修复有助于减少10%的动态功耗。对于一个公司和一个行业来说,这个数字是非常重要的,因为它(多年来)非常专注于节能和尽可能地挤出低效率。这种提高的效率来自于设计过程早期RTL阶段的寄存器切换优化。类似的分析将被用于寻找时钟树、存储器和组合逻辑的进一步改进。高通通过GPU功耗和性能的改进,在功耗效率方面取得了成功,这说明了早期使用Ansys PowerArtist进行RTL功耗分析的价值。

看看Ansys可以为您做什么

今天就联系我们

* =必填项

谢谢你的联系!

我们在这里回答你的问题,期待与你交谈。我们Ansys销售团队的一名成员将很快与您联系。

页脚的形象