Skip to main content

可能改变移动应用形态的iPhone 5核心——A6(翻译)

原文作者:後藤弘茂,日本知名IT网站PC Watch专栏作者,以细致的技术分析而闻名

原文链接:http://pc.watch.impress.co.jp/docs/column/kaigai/20120918_560341.html

译者的话:和Anand Lal Shimpi一样,後藤弘茂也是一位精于IC设计分析的作者,在iPhone 5发布后他也敏锐地注意到了Apple A6这块SoC,几乎和Anand Lal Shimpi同时发布了对于这块SoC内部结构的推测,在翻译了上篇Anandtech的相关文章之后,这次感谢兰斯提的翻译(本人日文不精),本人稍加润色之后将这篇後藤弘茂的文章全文放出,也供大家来详细参考。从全文其实可以看出,後藤弘茂的分析比Anandtech的文章更加深入一些,但是两者一致的是,都惊人地在产品发售前准确地猜中了A6的所有细节,那么这样的两篇文章就更有被我们仔细研究的价值了,哪怕是在iPhone 5已经正式发售的今天。

芯片变得更小,性能反倒提升

  iPhone 5搭载了Apple的新型移动SoC(片上系统)Apple A6登场。相比起iPhone 4SA5A6的制程进一步缩小,制程进步了(High-K/metal gate:HKMG),CPU核心架构革新了,预计在平均功耗降低的同时,峰值性能更上了一层。但另一方面,要把内存带宽拉上去很困难。这意味着什么呢?

  首先,由于制程进一步缩小,芯片的核心面积再次降到了100mm^2,减小了生产成本。AppleA系列SoC中,虽然从A4A5X通过Samsung45nm制程导致了核心偏大,但通过应该是32nm制程的A6再次回到了适中的核心面积。通过由于缩小制程而带来的晶体管数量提升,CPU微架构的革新也变得可能了。与之前P.A.SemiiPhone 4CPU设计公司,现已被Apple收购)的CPU架构设计团队制作的CPU对比,单线程性能的提升尤为突出。

  因此,在软件方面,预计运行web 应用的性能将会大幅度地增加。通过装载A6iPhone 5的登场,移动SoC的性能竞争将会进一步激化,也许这次会是从CPU核心数量的竞争,进入到单线程性能的竞争的时期吧。但是想要提升峰值性能的同时提高电源效率,则必须在CPU架构上做出改动。  

2倍于iPhone 4SA5CPU性能

  关于iPhone 5A6Apple官方明确表示它具有A5iPhone 4SCPU)的2倍的CPU性能和GPU性能的同时,芯片面积小了22%。同时,也表示了支持扩展到ARMv7s指令集。从进一步变得轻薄的iPhone 5的规格能看得出来平均的电量消耗减低了。虽然没有公开制程技术,但可以推测Apple使用Samsung32nm制程来控制了芯片面积。虽然内存也没有公布,但LPDDR3或者更高I/O带宽的内存尚未量产,必然还会是原来的LPDDR2LPDDR2的最高数据传输率从800MHz提升到了1066MHz)。

  AppleiPhone 4S所搭载的版本的A5,是由Samsung45nm LP制程所制造的。在Cortex-A9双核CPU上搭载SGX 543MP2双核GPULPDDR2 2×3264-bit)内存界面。A5的核心面积为122mm^2,以移动SoC来说算是相当大的芯片了。

  与之相对的是,iPhone5A6 CPU核虽然同样是双核构成,但CPU核自身的架构革新了。Apple长时间(约4年)一直在自主设计CPU核心,至今终于能看到成果问世了。GPU核是PowerVR 54x系列,这一块应该从A5开始就增强了。如果是2x32bit的内存接口,那么应该是由24G-bit DRAM(即2 x 512M = 1G)芯片构成。

移动SoC的核心面积演进

  

  作为Apple的芯片代工厂,除了一直以来的Samsung以外,曾传言有考虑过TMSC(台积电)。因此,尽管也有采用TSMC28nm制程的可能性,但考虑到核心面积和出货时间的话,应该是Samsung32nm的可能性比较高。

  

Apple3CPU核心架构选项

  使用Samsung 32nm制程让CPU性能翻倍的前提下,Apple有三个CPU核心架构的选项:(1)以常见的Cortex-A9架构构成四核CPU。(2)以新的Cortex-A15架构构成双核CPU。(3)自主开发ARM指令集架构的CPU核心。但无论是哪个选择,都能实现相当优秀的性能。

  首先,Samsung的情况的话,低功耗的制程技术很出色。Samsung32nm开始就采用了HKMG技术,相同漏电率的性能是普通工艺的1.4倍,相同性能下漏电率与普通工艺相比最大可以降低1/10。同时Samsung32nm制成的Cortex-A9架构实际运行性能非常强大,具备很高的CPU核心性能功耗比。同时,还采用了可以动态控制晶体管电压以提升性能,和抑制漏电率的Body Bias(晶体管体偏置)设计技术。

  

Samsung的32nm制程

  Samsung在自家的新一代移动SoC Exynos5上选择了Cortex-A15核心架构。Exynos5现已完成了芯片设计,在Samsung自家的晶圆厂中也完成了Cortex-A15的流片。预计Cortex-A15Cortex-A9一样具有省电的特性。因此可见在待机的时候,Cortex-A15也能极大地抑制电力消耗。

Samsung的Exynos5
Samsung的Exynos5

 

  相对于Cortex-A92路指令解码,Cortex-A15采用了3路指令解码,实行乱序执行的端口也更宽,因此可以并列执行更多的指令。因此,单核的性能比Cortex-A9更高,相对于Cortex-A9 2.5 DMIPS/MHz的性能指标,Contex-A15提升到了3.5 DMIPS/MHz,即1.4倍于前者。同时,流水线也变得更长了,可以达到比Cortex-A9更高的频率。因此,使用Cortex-A15的双核也可以达到Cortex-A9双核的双倍性能。

Cortex-A15的架构细节

 

Cortex-A系列的架构
Cortex-A系列的架构


低功耗高性能芯片的专家P.A. Semi

  但是,Apple所采取的道路应该是通过自主设计ARM指令集CPU核心,从而使双核性能翻倍。根据在于从时间上推测,Apple自主开发的CPU也应该基本完成了。

  Apple20084月收购了硅谷的帕罗奥图(Palo Alto,美国地名)的CPU设计企业 P.A. SemiP.A. Semi是曾经开发过DECAlpha 21064StrongARM等知名CPU的一群工程师所创立的公司,以设计低功耗高性能的CPU而见长。该公司在2006年发表的低功耗2GHzCPU PA6T,由于其每个核心消耗的电力最低仅有7W,在当时凭借超高的性能功耗比名噪一时。  

PA6T的平面图
PA6T的平面图

  

PA6T的功耗与架构单元
PA6T的功耗与架构单元

  

PA6T的电路系统架构图
PA6T的电路系统架构图

 

PA6T的核心架构
PA6T的核心架构

  PA6TPWRficient架构和P.A. Semi自主设计的处理器家族第一作。PA6T能极为精细地调节频率或单独调节每个核心的电压供给,以及通过监视供电状态的专用控制器等,使用各种各样的省电技术来谋求低功耗。该公司的技术受到了各方的注目,但在还没在市场上取得成功之前就被Apple收购了。

  根据业内人士的消息,P.A. Semi的设计阵容在被收购后还继续在Apple进行CPU的开发。CPU开发从零开始的话,到产品问世需要4年左右的时间。然后,从P.A. Semi被收购的那年算起,今年(2012年)正好是第4年。也就是说刚好是P.A. SemiCPU核心登场的时期。

  PA6T虽然功耗很低,但却是一个拥有4个微指令的分发器,5级执行流水线和2级取/存指令流水线的强大的核心。如果是P.A. Semi开发了A6CPU核心架构,那么应该毅然拥有低功耗高性能的特性。同Cortex-A15一样,即便是双核,也能达到2倍于双核Cortex-A9的性能。  

PA6T的前端
PA6T的前端

 

PA6T的调度器和执行流水线
PA6T的调度器和执行流水线

    

能够改变编程模式的CPU核心进化

  从最近的ARM CPU核心的进化来看,终于在绝对性能上达到了PC处理器的低端水平。比如被视作是和Cortex-A15同一个档次的AppleA6核心架构,或者是QualcommSnapdragon S4Krait核心架构。随之而来的是,在智能手机中拥有最大市场占有率的iPhone5,通过拥有达到低端PC处理器的性能,使得移动CPU的性能上限大幅提升。

  尤其重要的是,像这样新一代的ARM CPU核心架构正在增强单线程的性能。如果A6 CPU也是双核但达到2倍于Cortex-A9性能的话,那么可以推测是A6Cortex-A15采取了同一个思路,单线程的性能非常强大。

  单线程性能是至今为止手机应用处理器的弱点。而且,单线程性能的不足也是在手机上运行web应用的枷锁。因此,即便是积极推广web应用的Google,在Android上也不得不以别的编程模式(Dalvik模拟层和NDKNative Development Kit))作为核心。

  但是,通过单线程性能的提高,预计那些常用的例如JavaScript之类的Web应用,在移动终端上也能相对更顺畅地运行了。这是能影响到编程模式的变化。因为这意味着能将在PC上广泛使用的脚本语言加上web 浏览器的模型,在移动设备上也能被推广使用了。也就是说,我们可以期待,不管是PC还是移动设备,都可以使用同样的编程模式达到某种程度上相似的性能。iPhone5A6的登场也许吹响了移动设备编程模式的变革的号角。 

AppleSoC内部的另一个模块

  如果AppleA6是采用自己公司开发的核心架构的话,这就意味着Apple开始想要自己随心所欲地设计移动SoCIP(硅知识产权,可理解为自主核心架构)了,这是一种从芯片阶段按照自身需求和思想来开发硬件的野心。有传言Apple在秘密开发GPU,也在积极进行着例如拉拢AMD的图像部门的CTO之类的挖角举动。如果说Apple正在独自开发GPU核心的话,其目的应该在于开发更加适合通用计算的核心架构吧。毕竟通过OpenCL,热心推进GPU编程的就是Apple

  同时,这次的动作暗示了AppleSoC分化成iPad用和iPhone用的可能性。因为AppleA5X上把GPU核心扩展成了4核,内存接口使用了LPDDR2 4x32bit128-bit),使得高分辨率下的图像性能和内存带宽成为了首要因素。虽然还不知道A6的内存结构,但因为内存接口的功耗较高,使用比A5X更窄的2x32bit接口的可能性很大。下图是iPad从初代到A5X的变化示意图。

    

Apple Ax系列的过渡
Apple Ax系列的过渡

  如果第三代iPadA5XiPad专用,在A6系列也出现像A6X那样iPad专用扩展版CPU的话,那就意味着AppleSoC分成了分别面向iPhoneiPad两个系统。从画面解析度和电池容量上的巨大差别来看,这是一个合理的判断。从整体上来看,随着拉伸到2048×1536 像素的iPad平板分辨率的提升,iPad或其他平板电脑用的SoC的图形性能也会有所提升吧。

  顺便一说,如果面向平板电脑的SoC强化内存界面和内部GPU核心的话,内部总线应该也不得不进行强化吧。连接内部GPU核心和内存界面的总线如果没有配合内存带宽的话,GPU也无法发挥全部性能。因此由于纹理拾取和像素提升,内存带宽必须增加,否则这方面的处理可能会产生瓶颈。

  关于显示屏方面,这次AppleiPhone没有采用一直以来的3.5英寸显示屏,而是更细长的4英寸显示屏。解析度为1136×640 像素,PPIPixel per Inch,每英寸像素数)为326,变成了169的高宽比。到iPhone 4S为止,Apple使用的是3.5英寸的960×640 像素屏幕。这里的重点是,Apple维持了横向的分辨率,因此,以往的软件应用不用拉伸也能让界面适应新屏幕的宽度。

  这次的iPhone 5和以往不同,发售之前泄露的情报比较多,而且还都是正确的。以往Apple相关产品的透露出来的情报大多都是错误的,但这次iPhone5却不是这样。这可能和从iPhone5开始,组装的工厂从中国向越南移动的变化有关。

iPhone 5的A6 SoC,不是A15也不是A9,取而代之的是苹果自制的核心(翻译)

原文作者:北美第一大IT网站Anandtech站长Anand Lal Shimpi

原文链接:http://www.anandtech.com/show/6292/iphone-5-a6-not-a15-custom-core

译者的话:这是Anandtech站长亲自撰写的A6推测分析文章,必须得说的是,由于这篇文章写在iPhone 5发售之前,所以推测的内容不一定和实际的A6产品相符,但是从这篇文章里我们可以学习一些常见的IT产品分析思路,相信对各位对CPU/GPU有兴趣的朋友会有相当的帮助。由于译者水平所限,下文不免会有一些翻译错误,也恳请各位在评论中指正,谢谢。

废话少说,下面我们就来看看Anand Lal Shimpi是如何抽丝剥茧来为我们层层递进分析A6的架构的。

 

当苹果发布iPhone 5Phil Schiller代表官方正式宣布了之前已经泄露许久的信息:这台手机采用了苹果的新SoC(片上系统,可粗略地理解为CPU,但实际上集成的模块远多于CPU)——A6

像往常一样,苹果并没有公布频率、CPU架构、内存带宽或者GPU的详情,然而它给了我们一个CPU性能的暗示: 

在发布会举行之前,我们猜测iPhone 5SoC可能只是iPad 2,4iPad2的一个后期版本)所使用的32nm制程A5r2的一个简单频率提升版本。现在看来,苹果似乎只打算把这种架构保留在iPad上。 

然而,就在发布会之前,我得到一些信息指出A6并不会沿袭A5iPad 2/iPhone 4S所使用的SoC)中所使用过的Cortex A9核心架构。鉴于苹果过去一直依靠完整的ARM核心架构授权来构筑自己的SoC,以及A6预期的性能和一些传言,让我之前推测苹果的A6看起来应该是一颗Cortex A15的双核心SoC

结果证明我错了,但却给了我一个惊喜。

A6是苹果第一块在ARMv7指令集上自主设计的SoC,它的核心并不是常见的ARM设计好的Cortex A9或者Cortex A15核心架构,而是由苹果自主设计的一些东西。

来自Xcode 4.5的暗示

iPhone5将会运行iOS 6.0系统。为了配合iOS 6.0的发布,苹果向开发者发放了新版的开发工具Xcode 4.5。在Xcode 4.5中,有两个主要的改动:降级支持ARMv6指令集(用于ARM11架构的核心如iPhoneiPhone 3G),保持对ARMv7指令集(用于现在市面上常见的ARM 架构,包括Cortex A8/A9)支持的基础上,增加了一个新的指令集支持类型以配合A6ARMv7s

ARMv7ARMv7s指令集在LLVM C编译器(一种C语言编译器)上的主要区别是对于VFPv4VFP=向量浮点协处理器)的支持与否。ARMv7s支持VFPv4,而ARMv7不支持。

只有Cortex A5Cortex A7Cortex A15架构能够支持VFPv4ARMv7-A指令集,而常见的Cortex A8Cortex A9只能够支持到VFPv3。具体来说,Cortex A5Cortex A7实现了16个寄存器的VFPv4 FPUFPU=浮点运算单元),而与此同时Cortex A15更进一步达到了32个寄存器。重点是,如果一个架构支持VFPv4,那么它肯定不是Cortex A8或者Cortex A9

显而易见,苹果肯定不会使用Cortex A5或者Cortex A7这种比A5中使用的Cortex A9更加低性能的核心架构,所以我的推测是,很明显苹果在A6中使用了两个Cortex A15的核心。

出于某些保密原因,我很早之前就得知A6不会是基于Cortex A9核心的SoC,所以我立刻就推测出唯一一个可能的答案:A6使用了Cortex A15核心架构。我愚蠢地排除了另外一个主要的可能性:一个苹果自主开发的基于ARMv7指令集的核心架构。

在续航与性能之间取得平衡

ARM公司提供两种授权协议:一种是特定的处理器核心架构的授权(比如Cortex A8Cortex A9Cortex A15),和另一种使用特定ARM架构指令集来自行研发SoC的授权(比如ARMv7指令集)。很长时间一来,苹果都同时拥有这两种授权协议。类似情况的还有高通,它在一部分产品里使用了ARM核心架构的授权(比如MSM 8×25/骁龙S4 Play使用了Cortex A5核心架构),而在另一些自己研发的产品里使用了ARM架构指令集的授权(比如Scorpion/Krait架构就是基于ARMv7指令集自主研发)。

截止目前,我听说过苹果确实在自主研发基于ARM指令集的CPU核心架构,但是最后一次我得知的信息是苹果在这方面遇到了一些麻烦,于是我以为苹果自主设计的CPU还远远没有搞定。现实告诉我我错了。基于最近几天的信息收集,和与一些消息人士的讨论,我确认苹果A6 SoC正是基于其自主研发的核心架构,而不是Cortex A15

对于VFPv4的支持告诉我们这块CPU并不是由A5的简单频率提升而来。如果需要我做一个推测,我会认为苹果对Cortex A9核心架构做了类似于高通的改动:更宽而不是更长。还记得高通Krait架构对于Scorpion的改进吗?它拓宽了整个核心架构,将Scorpion的指令前端由两路改成三路,由顺序执行改为乱序执行。而ARM公司在从两路乱序执行到三路乱序执行的改进过程中还依靠增加流水线长度提升了时钟频率。

更长的流水线加上更宽的指令前端和执行引擎,致使功耗和性能双双提升。有传言说ARMCortex A15核心架构在设计之处是针对服务器市场的,并且只能够通过big.LITTLE(或者其他技术)才能够让Cortex A15适用于智能手机。对于苹果最关注的耗电问题而言,只有跳过Cortex A15核心架构同时保证性能提升才是更有意义的事情。

为什么不把基于Cortex A9核心架构的苹果A5频率提升一下(用在iPhone 5上,而是要重新设计A6)?听起来很诱人,毕竟有其他很多竞争对手就这么干过,但是从设计角度来看不是最佳选择。还记得我们在Pentium 4时代所学到的教训吗?长久地看,简单依靠提升频率来获得性能的大幅提升,会同时导致电源效率的下降。

要提高频率,就得先提高电压,而这会导致电量消耗呈指数增长。想要更长的续航时间,让CPU核心更多地运行在最低电压状态才是王道。正确提升CPU性能的方法,是提升架构效率(每时钟周期的指令执行能力提升),多线程,和少量的频率提升这几种手段一起使用。还记得05Intel推出的Pentium至尊版就达到了3.73GHz的高频率,然而7年过去了,现在Intel最快的CPU仅仅只运行在3.5GHz(睿频可达3.9GHz,但这不是通常状态),但是相比Pentium至尊版,核心数量翻了4倍,单个线程的性能翻了3倍。时间证明了,最应该改进提升的,不是频率,而是CPU的架构。

在发布会的幻灯片上,苹果承诺iPhone 5能够实现更长的续航时间,以及2倍于A5CPU性能。很显然A6将使用32nm的工艺制程,但在续航时间改进的前提下,只是提高A5的工艺制程并不足以提供2倍的性能提升。

尽管如此,如果不是因为一些外部的确认信息,我可能就已经认定A6很可能采用的是两个更高频率的Cortex A9核心了。事实上,我们原本猜测的A6 SoC真相就是高频Cortex A9而已。

基于此,我应该在未来给予苹果的CPU设计团队更高的期待。

坏消息是我对苹果自主设计的这个核心架构一无所知。苹果在CPU核心部分花费了不少心思,我相信A6差不多应该是与高通的KraitARM Cortex A15同等级的一个核心架构。稍微宽一些的前端,更多的执行资源,更灵活的乱序执行引擎,更深的缓存,更大的窗口,等等……支持VFPv4使它肯定比Cortex A9的面积要更大,它唯一的意义在于,让我们了解到苹果也愿意在其他任何地方挑战极限。我特别对A6的运行频率以及是否有一些聪明的动态频率调整能力有兴趣,赶紧来个人在iPhone 5上运行一下Geekbench(一款手机性能测试软件)吧。

关于A6有多少个核心,我同样没有任何消息。我猜是两个但是苹果谨慎地没有公布核心数量(过去他们也这么干)。等我们下周拿到手之后,才会得到更多的细节。我也真心期待ChipworksUBM(两个国外知名电子类媒体)拿到A6大干一番之后会发现什么。

A6GPU:是PowerVR SGX 543MP3吗?

苹果公布了一个简单的“2倍”来描述了A6GPU性能,并没有展示任何测试成绩,于是有4种可能的选项:

1.频率翻倍的PowerVR SGX 543MP2(和A5里集成的GPU一样);

2.和A5里集成的GPU频率一样的PowerVR SGX 543MP4

3.少量频率提升的PowerVR SGX 543MP3;

4.代号为Rogue的下一代PowerVR GPU

首先排除第4项,因为现在太早了,Rogue不可能量产。第1项看起来不错,但是会遇到和CPU提升频率一样的问题,即更高的电压才能爬升频率(当然,也有可能在新制程下电压反倒降低了),这会导致一样的功耗提升问题。

2项会导致对整个SoC核心区域施加(更高的)电压,在A5XThe New iPad所使用的SoC)上同样集成的PowerVR SGX 543MP4显示苹果只在迫不得已的时候才会这么干。

3项看起来是一种一举两得的选择。不用付出超大的核心面积也不用运行在超高的核心频率,同时,你仍旧能够得到双倍的性能。

 

3项是最恰当且很可能被苹果所选择的设计。别忘了总体来说芯片核心面积大小取决于外围I/O(输入输出端口)的设计。A5X采用了432bit LPDDR2内存控制器,这造就了一个巨大的核心面积。将其使用更小的制程制造来削减整个核心面积,这意味着苹果可以增加很多运算单元(来填补整个削减掉的面积,而不必做出一个内部大量无用区域的大芯片)或者砍掉一些内存界面来抵消。对比以上知识与实际情况可以得知,苹果在iPhone 5上不再需要那么高的内存带宽,理所当然的,A6的内存带宽就比A5X要低一些。

那么A6的内存带宽有多低?Phil Schiller提到A6A5的核心面积小22%。我们可以推测出这是与45nmA5对比,而不是32nmA5r2,这意味着不会有比A5更多的内存通道。换句话说,很可能A6A5一样,拥有2x32bit LPDDR2的界面。

写在最后

目前来说,没有更多可以补充的细节了。我们将在一周内拿到iPhone 5,并且不出意外在这一到两天之前就会有评测出现。那个时候真正的工作——找出苹果究竟在A6上做了些什么——才将开始。如果有人已经迫不及待地汇总一些优秀的底层iOS测试成绩,那么现在是时候开始了。

对苹果来说,这是一次巨大的赌注,当苹果开始垂直整合整个手机的时候,整个公司已经进入了另一个领域。自主设计一个CPU核心架构的风险是巨大的(毕竟ARM公司自身设计的核心架构已经通过无数设备和平台的测试证明,是非常可靠和稳定的选择),但收益可能更加庞大。就像高通发现的那样,这样做很显然是与众不同的(也许会统治市场?),如果你的核心设计和其他任何人相比都独一无二的情况下。

从现在开始,让我们看看苹果的CPU团队将会有多厉害吧。

近期热门国产智能手机分析

赶稿子的缘故,找个对我来说简单的内容来写=。=

从去年小米手机上市起算,国产智能手机进入了一个快速上升期,再加上华为+中兴+联想在低端千元机取得了不小的成就,标志着智能手机开始在国内进入普及阶段。也许是眼红小米的成功,也许是为了牢牢把持移动互联网的入口,或自行生产,或联合其他传统手机厂商,国内大量互联网厂商也迅速进入智能手机领域,造就了目前热闹非凡的市场。

乱花渐欲迷人眼,难得写篇正经文章(也许写着写着就不正经了……=w=),本文就试图分析目前一些热门国产主流手机——什么叫主流?价格在2K左右——的相关情况,也帮助大家找到适合自己需求的机型。 继续阅读

新牛排,新作料——简析“全新iPad”

2012年3月,Apple发布全新iPad

 

北京时间2012年3月8日凌晨,苹果在美国旧金山芳草地艺术中心发布第三代iPad,据苹果中国官网信息,苹果第三代iPad定名为“全新iPad”。全新 iPad配500万像素后置摄像头,采用A5X处理器,四核图形芯片。首批全新 ipad于2012年3月16日上市销售,上市地区包括中国香港。

伴随着全新iPad的发布,无数传得纷纷扰扰的小道消息终于尘埃落定,iPad3的各项参数也随着各种拆解和评测报告被媒体和玩家曝得通通透透,由于软件系统iOS在某种程度上基本一致(旧的iPad2可以随着系统更新获得全新的大部分新增软件功能),那么更多的卖点还是展现在硬件角度,接下来我们就来逐一看看全新iPad的各项改进 继续阅读