NVIDIA Tegra 4:A15架构细节、功耗控制
这款产品采用了(四加一)设计,即四颗CPU核心加上第五颗省电CPU核心,配有72颗GeForce GPU核心,采用28nm制程。同时它还是第一款使用了Cortex-A15架构的四核处理器(PS:架构是处理器的基础,对处理器整体性能起着决定性的作用,不同架构处理器在同等频率下性能可能会相差2-5倍不等),并且支持4G-LTE网络。
A15架构细节
A15的架构整数流水线为15级(Tegra 3为A9构架),重排序缓冲内保留大约128个已解码指令,分支预测同样得到了改进,能对长流水线做出一定的弥补。不仅如此,A15的前端相比A9加宽50%,指令拾取带宽翻番,有利于提升指令级并行(ILP),而为了充分利用三宽度发射,ARM大大增加了重排序缓冲(ROB)和所有相关数据结构的尺寸。
执行核心方面,A15的执行端口与执行单元都多于A9,均有助于提升ILP、单线程性能。除此之外,还采用了多重、独立的发射队列的方式,以保持高频率。每一个发射队列都可以接受最多三条指令,所有的发射队列都可以并行分发。
A15执行端口图解(图片来自My brivers.com)
相比A9,A15也可以执行乱序指令
A9上所有的浮点/NEON指令都必须顺序执行,但在A15上可以乱序(PS:独立载入可以乱序执行)
A15采用了集成式二级缓存结构
A9采用独立IP块。A15的一级、二级缓存延迟基本没变,不过在一些情况下应该会比A9多上1-2个时钟周期。二级缓存TLB和其它数据结构增大,以满足整个架构的需要。
功耗控制
NVIDIA宣称,经过SPECint2000测试(该测试可充分压榨CPU资源),Tegra 4/3的单线程整数成绩表现相同,但是Tegra 4的功耗要低40%,再用性能除以功耗,Tegra 4在能效方面要胜出75%。
Tegra 4用于移动设备时的一种政策:刻意限制频率以控制功耗。四个主力核心都使用相同的电压和频率层,只是每个核心都可以通过电源栅极单独开关,该设计与Intel设计方式相仿,缺点是每个核心电压与频率层都不是单独的,功耗方面还是有些欠缺。
除此之外,我们知道英伟达是独立显卡巨头,相信它的GPU方面比其他同等级别芯片的优势更加显而易见,Tegra 4拥有72颗GeForce GPU核心,其数量是上代Tegra 3的六倍之多。
不仅如此,该机还支持4K超高清视频解码,并有所谓的“PRISM 2 Display”显示技术,能够保证最清晰的画质体验,图形以及游戏性能自然可以得到大幅度提升。可以说,Tegra 3到Tegra 4在性能提升数倍的同时,构架与功耗控制都有一个质的飞越。
看完笔者的分析之后相信对Tegra 4有一个深入的了解。介绍完该机的处理器我们来看一下该机闪存等其他的芯片。
推荐经销商