跳到主要内容

Ansys advantage杂志

日期:2019年

早期模拟避免芯片损耗

作者:王亚东,美国圣地亚哥高通公司高级工程师

热约束性能是GPU设计的一个挑战。利用Ansys PowerArtist在芯片设计过程的早期(在RTL设计期间)执行独特的差分能量分析,高通工程师能够识别和修复GPU中的冗余切换,从而将关键设计模块的功率效率提高10%。

高通在设计流程的早期使用Ansys PowerArtist进行差分能量分析,每瓦特的性能提高了10%。”

智能手机和平板电脑制造商不断改变设计,寻找超越竞争对手的优势。每一款新机型都可以做得更多、更快,电池寿命更长。与此同时,应用程序和后台功能消耗越来越大的电量。

作为移动技术领域的全球领导者,高通的工程师们一直在探索提高移动设备半导体组件性能的方法。特别是图形处理单元(GPU),对于游戏等消费类应用程序来说是一个关键组件。想象一下,一个消费者在手机上玩电子游戏。GPU运行速度越快,游戏持续时间越长,GPU耗电越多,导致手机温度升高。在某种程度上,手机会自动降低时钟速度(在合理的范围内),通过减少功耗来冷却自己。但这会导致游戏速度变慢。虽然令人讨厌,但这些减速是手机设计的一部分。这种受热约束的性能正成为GPU设计中的关键性能指标。

高通(Qualcomm)没有只是忍受这些放缓,而是正在为此做些事情。在确定微架构时,在寄存器传输级别(RTL),使用Ansys PowerArtist模拟在开发过程早期对gpu进行差分能量分析,优化gpu的功率效率并保持器件温度较低。

使用PowerArtist实现低功耗RTL设计的七个步骤


Ansys PowerArtist可以在几个小时内分析真实世界的用例,这比标准方法快了几个数量级。”

早期RTL功率分析

高通之所以选择Ansys PowerArtist进行RTL的功耗分析和降低,是因为其评估功耗的现实方法。例如,传统的功率分析仅在几微秒内对设计活动进行采样,这段时间太短,无法提供真实的快照。相反,Ansys PowerArtist分析现实世界的用例(如高清视频帧),在几个小时内创建电源配置文件,这比标准方法快了几个数量级。除了功率配置,它还允许工程师通过独特的设计实现效果(如时钟树)建模,在RTL可靠地为设计的不同部分预算功率。它支持通过可量化指标进行的能效分析、假设功率趋势分析、用于追踪问题根源的功率调试,以及功率回归,这在一个看似很小的修复突然在其他地方导致功率激增时非常有用。

查看大图

基于rtl的功率效率可以实现早期和可靠的设计决策。


差能分析

在追求功率优化设计的过程中,高通设计团队首先通过工艺选择和功率孤岛最小化功率泄漏。接下来,他们专注于最小化冗余开关活动,以找到动态节能方案。他们采用了一种巧妙的方法来完成这项任务:他们没有直接在GPU中寻找冗余切换——这是一个耗时、繁琐的过程——而是通过模拟两个版本的GPU以不同的速度运行来比较它们。例如,通过增加延迟来模拟饥饿或失速来模拟较慢的速度。如果最初的设计是最优的时钟控,那么两个运行的网络切换数量应该相同,并且两个运行的总能量应该相同。然而,如果在原始设计中存在任何门控效率低下,那么设计中的冗余开关将在较慢的运行中在较长时间内处于活动状态,因此该运行中的集成能量将高于原始运行。


对于较慢的矢量,较高的能量暴露了多余的活动。

一个独特的方法差分能量和功率分析


“在开发过程的早期,在寄存器传输级别(RTL)进行差分能量分析,可以优化gpu的效率,并降低移动设备的温度。”

定位冗余活动

在发现较慢运行时的集成能量较高,表明存在门控效率低下的情况后,高通工程师在动态功率分析方面进一步进行了分析。除了总能量外,PowerArtist还将开关和内部能量贡献(在每个级别)分开,他们能够精确定位冗余活动的位置。

内部能量是在门(如寄存器)内部耗散的能量,而开关能量是与门之间的互连相关的能量。在较慢的模拟运行中,寄存器上的冗余数据输入或输出切换将导致开关和内部能量的增加,而时钟输入上的冗余切换只会增加内部能量。有四种可能的切换场景可以帮助确定冗余。


系统的方法查明冗余的寄存器引脚切换通过调查四种情况。


如果在内部或开关组件中没有差异,则优化是理想的。在其他情况下,很容易确定哪里必须有冗余活动。这些包括:

  1. 当数据稳定时,时钟引脚上的额外切换
  2. 当时钟关闭时,额外的开关在D/Q引脚上
  3. D/Q引脚和时钟引脚上的额外开关


主要的效率提升

使用这种新颖的差分能量分析方法,高通工程师深入寻找候选模块进行更详细的分析,包括修复可能产生重大影响的单个寄存器。进行这些初始修复有助于将动态功耗降低10%。这个数字对于一个公司和一个行业来说意义重大,因为它(多年来)一直非常关注节能和尽可能地消除低效率。这种提高的效率来自于设计过程早期的寄存器切换优化,即在RTL阶段。将进行类似的分析,以寻找时钟树、存储器和组合逻辑方面的进一步改进。高通公司通过改进其GPU功耗和性能,在功耗效率方面取得了成功,这说明了使用Ansys PowerArtist进行早期RTL功耗分析的价值。

他说:“我很高兴见到你。

Contactez-nous今天

* =冠军要求

谢谢你的联系人!

我们在这里回答您的问题,并期待与您交谈。我们Ansys销售团队的一名成员将很快与您联系。

图片替换页面