第355章 天权4号功耗再优化目标(1 / 2)

孙总监坐在主位,面前是一台终端,上面显示着天权4号过去一周的功耗数据——待机功耗五点三毫瓦,动态功耗峰值一点八瓦,平均功耗零点四五瓦。这些数据在同类晶片中已经是领先水平,但孙总监的眉头依然紧锁。

天权4号的小批量试产已经启动,首批五百颗晶片良率百分之九十四点二,性能指标全部达标。但在功耗测试环节,团队发现了一个问题——待机功耗虽然只有五点三毫瓦,比天权3号降低了百分之四十,但和理论仿真值四点零毫瓦还有差距。这百分之三十的差距,意味着电池续航时间会缩短大约八个小时。对于手机丶手表等对功耗极其敏感的终端产品来说,八个小时的续航差距,可能就是消费者选择天权4还是竞品的关键因素。

会议开始前,孙总监先让功耗优化团队的负责人汇报了测试数据。那是一个三十出头的工程师,姓顾,之前在旧秩序的一家晶片公司做过低功耗设计,经验丰富。

本书由??????????.??????全网首发

「天权4号小批量试产的五百颗晶片,我们抽取了五十颗做了完整的功耗测试。待机功耗平均五点三毫瓦,最高五点八毫瓦,最低四点九毫瓦。动态功耗平均一点八瓦,最高二点一瓦,最低一点六瓦。整体功耗水平符合设计规格,但离最优目标还有差距。」

「待机功耗偏高的主要原因有三个——第一,漏电流控制不够理想。天权4号用了十四纳米工艺,理论上漏电流应该比二十八纳米降低百分之五十,但实际只降低了百分之三十五。第二,时钟网络的功耗优化不彻底。为了满足时序收敛,时钟树设计偏保守,冗余路径较多。第三,亚阈值电路的成熟度不够。天权4号只在部分模块用了亚阈值设计,大部分模块还是传统设计。」

孙总监问了一个关键问题:「如果把亚阈值设计扩展到全晶片,待机功耗能降到多少?」

顾工程师调出了一份仿真数据。「如果全晶片采用亚阈值设计,待机功耗理论上可以降到一点五毫瓦。但有两个问题——第一,亚阈值电路对工艺波动敏感,良率会下降。我们估算,全晶片亚阈值设计的良率可能只有百分之七十左右。第二,亚阈值电路的工作频率上限较低,动态性能会受影响。CPU主频可能从一点八吉赫兹降到一点二吉赫兹。」

章宸从晶片架构的角度补充了一句:「性能和功耗的权衡,需要看产品定位。天权4号是旗舰晶片,性能不能妥协。如果为了降功耗而牺牲性能,得不偿失。」

会议室的门被推开,赵静走了进来,身后跟着中央研究院的王研究员。赵静昨天已经和孙总监约好,今天带亚阈值电路团队来讨论功耗优化方案。

「孙总,王研究员把亚阈值电路的最新进展带来了。上周他们在实验室里做出了一个测试晶片,待机功耗零点八毫瓦,主频一点五吉赫兹。这个结果比之前的仿真好很多。」赵静坐下,把一台终端连上投影仪。

王研究员站起来,走到投影幕前,调出了测试晶片的数据。

「这是我们在十四纳米工艺上流片的一颗测试晶片,包含了完整的CPU核心丶缓存丶以及总线。设计上采用了我们论文中提出的亚阈值电路设计方法,但在几个关键路径上做了优化——第一,时序关键路径用常规电压设计,非关键路径用亚阈值设计。第二,采用了自适应电压缩放技术,根据工艺角和工作温度动态调整电压。第三,时钟网络做了局部门控,空闲模块的时钟完全关断。」

「测试结果——待机功耗零点八毫瓦,动态功耗一点二瓦,主频一点五吉赫兹。和天权4号当前的方案比,待机功耗降低百分之八十五,动态功耗降低百分之三十三,主频降低百分之十七。功耗和性能的平衡,比预期的好。」

章宸盯着测试数据看了很久。「主频一点五吉赫兹,比天权4号的一点八吉赫兹低了百分之十七。对于手机SoC来说,这个性能差距会不会太大?」

王研究员调出了应用场景的性能分析。「我们对手机常用应用做了仿真——网页浏览丶视频播放丶游戏丶拍照。一点五吉赫兹和一点八吉赫兹的差异,在百分之九十的应用场景中用户感知不到。只有在大型游戏和视频渲染等重负载场景,才会有明显差异。但这类场景占比不到百分之十。百分之九十的时间里,用户享受的是更长的续航。」

孙总监沉思了一会儿,说:「能不能做一个折中方案——CPU大核保持常规设计,保证峰值性能。小核和GPU用亚阈值设计,降低日常功耗。这样既保留了旗舰晶片的性能标签,又把待机功耗降下来了。」

赵静眼睛一亮。「这个思路好。大小核异构,大核性能优先,小核功耗优先。天权4号已经有了大小核架构,只是大核和小核用的是同样的设计。如果把小核改成亚阈值设计,大核保持不变,待机功耗可以降多少?」

顾工程师快速估算了一下。「小核占了晶片面积的大约百分之十五,但待机状态下小核的漏电流贡献了大约百分之三十的待机功耗。如果小核改用亚阈值设计,小核部分的待机功耗可以降低百分之九十,整体待机功耗降低大约百分之二十七。从五点三毫瓦降到三点九毫瓦左右。」

「三点九毫瓦还是离一点五毫瓦有差距。」章宸说。

王研究员说:「如果大核也做部分亚阈值优化——不是全盘改成亚阈值,而是把大核的非关键路径改成亚阈值设计,关键路径保持常规设计。这样可以再降一部分待机功耗,同时不影响峰值性能。我们在测试晶片上做过类似的混合设计,待机功耗可以降到二点五毫瓦,主频一点七吉赫兹。」

孙总监在笔记本上记下了「二点五毫瓦丶一点七吉赫兹」这两个数字。

会议进入第二个议题——功耗优化的技术方案和时间表。

王研究员调出了一张技术路线图。

「天权4号的功耗再优化,我们建议分三步走。」

「第一步,小核亚阈值化。把天权4号的四个小核全部改用亚阈值设计,大核保持不变。这一步改动最小,风险最低。预计需要六周完成设计变更,四周完成验证,十周后可以出工程样片。待机功耗目标三点八毫瓦,峰值性能不变。」

「第二步,大核混合设计。在大核中引入亚阈值设计,但只限于非关键路径。关键路径的时序和电压保持不变。这一步改动较大,需要重新做时序收敛和物理设计。预计需要十二周完成设计变更,八周完成验证,二十周后出工程样片。待机功耗目标二点五毫瓦,峰值性能一点七吉赫兹。」

「第三步,全晶片自适应电压缩放。根据晶片的工艺角丶温度丶以及负载情况,动态调整每个模块的电压。低负载时,全晶片进入亚阈值模式,待机功耗降到一点五毫瓦。高负载时,大核升压到常规电压,保证峰值性能。这一步需要增加电压调节电路和自适应控制算法,改动最大。预计需要二十四周完成设计变更,十二周完成验证,三十六周后出工程样片。」

章宸问了一个问题:「三步走,每一步都要重新流片?流片成本和周期怎么算?」