三星,作为目前在移动互联网终端领域唯一能与苹果相抗衡的厂商,在去年的10月份就提前公布了自家的下一代ARM架构处理器 Eyxnos 5 DUAL(双核)系列芯片的参数规格。即是上游厂商也是下游厂商,在智能手机以及平板电脑制造行业里,三星拥有一套完整的从内到外的生产链条,不依赖外人不需看别人眼色行事的三星凭借着自身的这种先天优势,正一步步扩大它在移动互联网领域的影响力。
Exynos 5 DUAL 系列双核处理器已经在去年10月发布(图片来自三星)
由于抢先发布了下一代移动处理器芯片,并且也没有在发布会上带来更多有关下一代Galaxy系列手机以及Galaxy Tab系列平板电脑的相关消息,三星此次在CES 2013大展上的表现显得有些星光黯淡,当然笔者仅仅指的是移动终端这个领域,不包括它在家电以及显示面板方面的内容,因为这家伙所涉及的圈子实在是太大了。
■三星发布Eyxnos 5 OCTA处理芯片
如果说三星真的是想以双核的Eyxnos 5 DUAL系列处理器来与英伟达、高通的新四核处理器来抗衡的话,笔者相信很多三星的粉丝会离它而去,即使三星一直在淡化硬件性能强调交互体验的重要性。然而在开展后的第二天,三星终于为我们带来了可以满足之前期望的大惊喜,北京时间1月10日上午,三星在CES 2013展会上发布了首款八核ARM架构处理器——Exynos 5 OCTA系列处理芯片。
Exynos 5 OCTA是全球首款八核ARM架构移动处理器,采用28nm制程,基于ARM的big.LITTLE解决方案,包含Cortex-A7以及Cortex-A15两种架构,实际上就是在一个芯片封装中包含了两个四核芯片,分别为1.8GHz的Cortex-A15架构处理器和1.2GHz的Cortex-A7构架处理器。这种架构允许高性能和低性能内核配合工作,性能较强的Cortex-A15架构核心用来处理游戏或视频等高负荷的任务,而能源利用率很高的Cortex-A7构架四核处理器负责文本、电子邮件等负荷相对较低的任务。
三星使用一台配置Eyxnos 5 OATC处理芯片的平板展示多任务运行
三星电子组件业务部门总裁禹南星(Stephen Woo)在CES 2013展会上发表演讲时说,这种芯片的可用于高端智能手机和平板电脑。据三星官方数据,Exynos 5 OCTA八核处理器的这种架构具备低功耗和高性能的特色,3D性能将达到目前已有产品的两倍。比三星目前的芯片最多节能70%。
■ARM big.LITTLE解决方案
虽说ARM早在2011年的第三季度就提出了big.LITTLE这种将两核处理芯片粘合在一起的概念,但是将它付诸实践的第一款处理芯片却在2013年的第一季度才出现。不同于原有多核处理芯片中单一核心的堆叠,ARM提出的新big.LITTLE解决方案通过Corelink核心互联的方式把两个多核集群的高速缓存中的数据进行互通(可以使两个相同核心,也可以是不同核心)。
为了平衡功耗与性能而出现的ARM big.LITTLE解决方案(图片来自ARM)
通过CCI-400高速缓存互联保持不同设备中数据的一致性(图片来自ARM)
对于三星这款Exynos 5 OCTA八核处理芯片来说,它使用了CoreLink CCI-400 高速缓存一致性互连方式连接一个四核的Cortex-A15核心以及一个四核的Cortex-A7核心。那么在实际的应用场景中,我们知道系统可以按需分配这两款处理核心的负载,但是一个疑问随之产生。
■ARM big.LITTLE能否实现物理多核效果?
三星在发布会上有讲使用过程中的复杂应用交给四核Cortex-A15核心处理,简单应用交给四核Cortex-A7核心处理,那么它们是否可以协同处理同一个任务,是否可以像物理多核心处理器那样工作呢?
由于暂时还没有使用双四核Cortex-A15架构的处理芯片问世,所以我们就以这颗三星 Exynos 5 OCTA为例来分析一下。首先我们要清楚虽然Cortex-A15核心与Cortex-A7核心使用了完全相同的指令集与功能集,但是由于指令执行方式上的不同,二者在性能上是存在差距的。
如果两颗核心共同工作的方式可以实现,那么可参考的模型就是核显与独显之间的混合交火。在ARM提供的关于big.LITTLE解决方案的技术文档中出现了这样一段文字。
这段文字的大概意思就是,一个big.LITTLE系统包含了由CCI-400高速缓存互联方式连接的一个Cortex-A15核心和一个Cortex-A7核心,它们可以同时被唤醒去共同执行一段代码,实现方式就是我们通常所说的异构计算。当一个进程的需求被提过来,如果它需要这个芯片提供高性能的处理能力,那么就会同时唤醒Cortex-A15核心以及Cortex-A7核心,不然就仅仅使用Cortex-A7核心就够了,可见Exynos 5 OCTA中的四核Cortex-A15与四核Cortex-A7核心是可以实现共同协作的工作方式的。
通过CCI-400连接的Cortex-A15核心与Cortex-A7核心(图片来自ARM)
那么由于Cortex-A15核心与Cortex-A7核心存在性能上的差异,当一个任务被提出处理需求时,通过big.LITTLE方案所连接的两个核心肯定是无法像物理多核心处理器那样被平均分配去执行任务的,并且由于二者使用了完全独立的二级高速缓存,所以在进行数据共享时会出现多种解决方案。
为了让两颗核心可以进行数据共享,上面我们说到了通过CCI-400高速缓存进行连接的方式可以实现这个功能,那么CCI-400可以理解为一条带有三级高速缓存的总线,Cortex-A15核心与Cortex-A7核心各自二级缓存中的数据可以通过它保持统一。
■big.LITTLE怎样处理多线程的延迟等待
那么在协同处理同一项任务时,两颗核心可能会出现处理时间不统一的问题,比如渲染一幅图像,当它被分成多个区块交给Eyxnos 5 OCTA处理器去处理时,CCI-400将需要处理的数据均匀分配给了Cortex-A15核心以及Cortex-A7核心,那么由于分配方式可能不是非常的智能,或多或少的会出现两颗核心完成各自渲染工作的时间不统一,所以按照以往的处理方式就会出现延迟等待的问题。
为了解决这个问题,ARM在官方提供的技术文档中特别有提到“CCI-400 支持屏障传播以强制事务排序,同时允许处理器生成多个未完成的事务,从而最大限度地减少 CPU 停止以等待之前的事务完成。”那么也就是说,CCI-400可以感知两个核心完成工作的时间,并把未完成的任务再次重新分配给两个核心,这样就可以是两颗核心始终保持高效的运行状态。
■对比英伟达的“4+1”核处理芯片
三星 Exynos 5 OCTA的“4+4”处理芯片很容易让我们联想到英伟达的“4+1”处理芯片。同样是一大加一小的组合,那么二者之间的对比肯定是在所难免。在结构上英伟达应该使用的不是标准的big.LITTLE解决方案,但是从原理上二者应该是有异曲同工的地方。
big.LITTLE解决方案下功耗与性能之间的平衡(图片来自ARM)
那么从性能方面来考虑,四核Cortex-A15与四核Cortex-A7的组合理论上完胜四核的Cortex-A15加一个英伟达自家设计的省电核心,所以三星的Exynos 5 OCTA八核处理芯片应该是目前最快速的民用级ARM架构处理芯片。但从最低功耗角度的来看,英伟达的Tegra 4应该有更好的表现。
上面所提到的这几款芯片是四家厂商在此次CES 2013大展上公布的新产品,它们也代表了这个星球上在便携式移动终端处理器设计方面的最高水平。可以想象的是我们未来在智能手机或者是平板电脑上所体验到的内容会因为这些处理芯片的进步而变得更绚丽多彩,那么随着CES 2013的落幕我们期待能够看到更多的搭载这些芯片的产品出现,英伟达的Project SHIELD就是个很好的例子。
由于两款国产芯片全志 A31以及瑞芯微 RK3188在CES 2013大展之前就已经公布,并且在本次展览中并没有什么新特性展示出来,所以笔者在这里就不多做介绍了,想要了解相关信息的网友可以参看笔者之前的文章。《芯的战争 来年平板电脑主流处理器前瞻》
推荐经销商