Skip to main content

可能改变移动应用形态的iPhone 5核心——A6(翻译)

原文作者:後藤弘茂,日本知名IT网站PC Watch专栏作者,以细致的技术分析而闻名

原文链接:http://pc.watch.impress.co.jp/docs/column/kaigai/20120918_560341.html

译者的话:和Anand Lal Shimpi一样,後藤弘茂也是一位精于IC设计分析的作者,在iPhone 5发布后他也敏锐地注意到了Apple A6这块SoC,几乎和Anand Lal Shimpi同时发布了对于这块SoC内部结构的推测,在翻译了上篇Anandtech的相关文章之后,这次感谢兰斯提的翻译(本人日文不精),本人稍加润色之后将这篇後藤弘茂的文章全文放出,也供大家来详细参考。从全文其实可以看出,後藤弘茂的分析比Anandtech的文章更加深入一些,但是两者一致的是,都惊人地在产品发售前准确地猜中了A6的所有细节,那么这样的两篇文章就更有被我们仔细研究的价值了,哪怕是在iPhone 5已经正式发售的今天。

芯片变得更小,性能反倒提升

  iPhone 5搭载了Apple的新型移动SoC(片上系统)Apple A6登场。相比起iPhone 4SA5A6的制程进一步缩小,制程进步了(High-K/metal gate:HKMG),CPU核心架构革新了,预计在平均功耗降低的同时,峰值性能更上了一层。但另一方面,要把内存带宽拉上去很困难。这意味着什么呢?

  首先,由于制程进一步缩小,芯片的核心面积再次降到了100mm^2,减小了生产成本。AppleA系列SoC中,虽然从A4A5X通过Samsung45nm制程导致了核心偏大,但通过应该是32nm制程的A6再次回到了适中的核心面积。通过由于缩小制程而带来的晶体管数量提升,CPU微架构的革新也变得可能了。与之前P.A.SemiiPhone 4CPU设计公司,现已被Apple收购)的CPU架构设计团队制作的CPU对比,单线程性能的提升尤为突出。

  因此,在软件方面,预计运行web 应用的性能将会大幅度地增加。通过装载A6iPhone 5的登场,移动SoC的性能竞争将会进一步激化,也许这次会是从CPU核心数量的竞争,进入到单线程性能的竞争的时期吧。但是想要提升峰值性能的同时提高电源效率,则必须在CPU架构上做出改动。  

2倍于iPhone 4SA5CPU性能

  关于iPhone 5A6Apple官方明确表示它具有A5iPhone 4SCPU)的2倍的CPU性能和GPU性能的同时,芯片面积小了22%。同时,也表示了支持扩展到ARMv7s指令集。从进一步变得轻薄的iPhone 5的规格能看得出来平均的电量消耗减低了。虽然没有公开制程技术,但可以推测Apple使用Samsung32nm制程来控制了芯片面积。虽然内存也没有公布,但LPDDR3或者更高I/O带宽的内存尚未量产,必然还会是原来的LPDDR2LPDDR2的最高数据传输率从800MHz提升到了1066MHz)。

  AppleiPhone 4S所搭载的版本的A5,是由Samsung45nm LP制程所制造的。在Cortex-A9双核CPU上搭载SGX 543MP2双核GPULPDDR2 2×3264-bit)内存界面。A5的核心面积为122mm^2,以移动SoC来说算是相当大的芯片了。

  与之相对的是,iPhone5A6 CPU核虽然同样是双核构成,但CPU核自身的架构革新了。Apple长时间(约4年)一直在自主设计CPU核心,至今终于能看到成果问世了。GPU核是PowerVR 54x系列,这一块应该从A5开始就增强了。如果是2x32bit的内存接口,那么应该是由24G-bit DRAM(即2 x 512M = 1G)芯片构成。

移动SoC的核心面积演进

  

  作为Apple的芯片代工厂,除了一直以来的Samsung以外,曾传言有考虑过TMSC(台积电)。因此,尽管也有采用TSMC28nm制程的可能性,但考虑到核心面积和出货时间的话,应该是Samsung32nm的可能性比较高。

  

Apple3CPU核心架构选项

  使用Samsung 32nm制程让CPU性能翻倍的前提下,Apple有三个CPU核心架构的选项:(1)以常见的Cortex-A9架构构成四核CPU。(2)以新的Cortex-A15架构构成双核CPU。(3)自主开发ARM指令集架构的CPU核心。但无论是哪个选择,都能实现相当优秀的性能。

  首先,Samsung的情况的话,低功耗的制程技术很出色。Samsung32nm开始就采用了HKMG技术,相同漏电率的性能是普通工艺的1.4倍,相同性能下漏电率与普通工艺相比最大可以降低1/10。同时Samsung32nm制成的Cortex-A9架构实际运行性能非常强大,具备很高的CPU核心性能功耗比。同时,还采用了可以动态控制晶体管电压以提升性能,和抑制漏电率的Body Bias(晶体管体偏置)设计技术。

  

Samsung的32nm制程

  Samsung在自家的新一代移动SoC Exynos5上选择了Cortex-A15核心架构。Exynos5现已完成了芯片设计,在Samsung自家的晶圆厂中也完成了Cortex-A15的流片。预计Cortex-A15Cortex-A9一样具有省电的特性。因此可见在待机的时候,Cortex-A15也能极大地抑制电力消耗。

Samsung的Exynos5
Samsung的Exynos5

 

  相对于Cortex-A92路指令解码,Cortex-A15采用了3路指令解码,实行乱序执行的端口也更宽,因此可以并列执行更多的指令。因此,单核的性能比Cortex-A9更高,相对于Cortex-A9 2.5 DMIPS/MHz的性能指标,Contex-A15提升到了3.5 DMIPS/MHz,即1.4倍于前者。同时,流水线也变得更长了,可以达到比Cortex-A9更高的频率。因此,使用Cortex-A15的双核也可以达到Cortex-A9双核的双倍性能。

Cortex-A15的架构细节

 

Cortex-A系列的架构
Cortex-A系列的架构


低功耗高性能芯片的专家P.A. Semi

  但是,Apple所采取的道路应该是通过自主设计ARM指令集CPU核心,从而使双核性能翻倍。根据在于从时间上推测,Apple自主开发的CPU也应该基本完成了。

  Apple20084月收购了硅谷的帕罗奥图(Palo Alto,美国地名)的CPU设计企业 P.A. SemiP.A. Semi是曾经开发过DECAlpha 21064StrongARM等知名CPU的一群工程师所创立的公司,以设计低功耗高性能的CPU而见长。该公司在2006年发表的低功耗2GHzCPU PA6T,由于其每个核心消耗的电力最低仅有7W,在当时凭借超高的性能功耗比名噪一时。  

PA6T的平面图
PA6T的平面图

  

PA6T的功耗与架构单元
PA6T的功耗与架构单元

  

PA6T的电路系统架构图
PA6T的电路系统架构图

 

PA6T的核心架构
PA6T的核心架构

  PA6TPWRficient架构和P.A. Semi自主设计的处理器家族第一作。PA6T能极为精细地调节频率或单独调节每个核心的电压供给,以及通过监视供电状态的专用控制器等,使用各种各样的省电技术来谋求低功耗。该公司的技术受到了各方的注目,但在还没在市场上取得成功之前就被Apple收购了。

  根据业内人士的消息,P.A. Semi的设计阵容在被收购后还继续在Apple进行CPU的开发。CPU开发从零开始的话,到产品问世需要4年左右的时间。然后,从P.A. Semi被收购的那年算起,今年(2012年)正好是第4年。也就是说刚好是P.A. SemiCPU核心登场的时期。

  PA6T虽然功耗很低,但却是一个拥有4个微指令的分发器,5级执行流水线和2级取/存指令流水线的强大的核心。如果是P.A. Semi开发了A6CPU核心架构,那么应该毅然拥有低功耗高性能的特性。同Cortex-A15一样,即便是双核,也能达到2倍于双核Cortex-A9的性能。  

PA6T的前端
PA6T的前端

 

PA6T的调度器和执行流水线
PA6T的调度器和执行流水线

    

能够改变编程模式的CPU核心进化

  从最近的ARM CPU核心的进化来看,终于在绝对性能上达到了PC处理器的低端水平。比如被视作是和Cortex-A15同一个档次的AppleA6核心架构,或者是QualcommSnapdragon S4Krait核心架构。随之而来的是,在智能手机中拥有最大市场占有率的iPhone5,通过拥有达到低端PC处理器的性能,使得移动CPU的性能上限大幅提升。

  尤其重要的是,像这样新一代的ARM CPU核心架构正在增强单线程的性能。如果A6 CPU也是双核但达到2倍于Cortex-A9性能的话,那么可以推测是A6Cortex-A15采取了同一个思路,单线程的性能非常强大。

  单线程性能是至今为止手机应用处理器的弱点。而且,单线程性能的不足也是在手机上运行web应用的枷锁。因此,即便是积极推广web应用的Google,在Android上也不得不以别的编程模式(Dalvik模拟层和NDKNative Development Kit))作为核心。

  但是,通过单线程性能的提高,预计那些常用的例如JavaScript之类的Web应用,在移动终端上也能相对更顺畅地运行了。这是能影响到编程模式的变化。因为这意味着能将在PC上广泛使用的脚本语言加上web 浏览器的模型,在移动设备上也能被推广使用了。也就是说,我们可以期待,不管是PC还是移动设备,都可以使用同样的编程模式达到某种程度上相似的性能。iPhone5A6的登场也许吹响了移动设备编程模式的变革的号角。 

AppleSoC内部的另一个模块

  如果AppleA6是采用自己公司开发的核心架构的话,这就意味着Apple开始想要自己随心所欲地设计移动SoCIP(硅知识产权,可理解为自主核心架构)了,这是一种从芯片阶段按照自身需求和思想来开发硬件的野心。有传言Apple在秘密开发GPU,也在积极进行着例如拉拢AMD的图像部门的CTO之类的挖角举动。如果说Apple正在独自开发GPU核心的话,其目的应该在于开发更加适合通用计算的核心架构吧。毕竟通过OpenCL,热心推进GPU编程的就是Apple

  同时,这次的动作暗示了AppleSoC分化成iPad用和iPhone用的可能性。因为AppleA5X上把GPU核心扩展成了4核,内存接口使用了LPDDR2 4x32bit128-bit),使得高分辨率下的图像性能和内存带宽成为了首要因素。虽然还不知道A6的内存结构,但因为内存接口的功耗较高,使用比A5X更窄的2x32bit接口的可能性很大。下图是iPad从初代到A5X的变化示意图。

    

Apple Ax系列的过渡
Apple Ax系列的过渡

  如果第三代iPadA5XiPad专用,在A6系列也出现像A6X那样iPad专用扩展版CPU的话,那就意味着AppleSoC分成了分别面向iPhoneiPad两个系统。从画面解析度和电池容量上的巨大差别来看,这是一个合理的判断。从整体上来看,随着拉伸到2048×1536 像素的iPad平板分辨率的提升,iPad或其他平板电脑用的SoC的图形性能也会有所提升吧。

  顺便一说,如果面向平板电脑的SoC强化内存界面和内部GPU核心的话,内部总线应该也不得不进行强化吧。连接内部GPU核心和内存界面的总线如果没有配合内存带宽的话,GPU也无法发挥全部性能。因此由于纹理拾取和像素提升,内存带宽必须增加,否则这方面的处理可能会产生瓶颈。

  关于显示屏方面,这次AppleiPhone没有采用一直以来的3.5英寸显示屏,而是更细长的4英寸显示屏。解析度为1136×640 像素,PPIPixel per Inch,每英寸像素数)为326,变成了169的高宽比。到iPhone 4S为止,Apple使用的是3.5英寸的960×640 像素屏幕。这里的重点是,Apple维持了横向的分辨率,因此,以往的软件应用不用拉伸也能让界面适应新屏幕的宽度。

  这次的iPhone 5和以往不同,发售之前泄露的情报比较多,而且还都是正确的。以往Apple相关产品的透露出来的情报大多都是错误的,但这次iPhone5却不是这样。这可能和从iPhone5开始,组装的工厂从中国向越南移动的变化有关。

1天

将心化为一片空白

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*