Tegra K1 64位处理器版本有什么特别?
目前安卓5.0也已经全面采用64位计算来提升系统性能,但只有64位处理器才能将它正常运行。所以采用安卓5.0系统的Nexus 9也必然选用支持64位运算的Tegra K1。
前文已经和大家介绍了,这款代号为“丹佛”的Tegra K1处理器是Nvidia自行设计的,它承载着英伟达构建一套强大计算平台的帝国梦。然而自行设计处理器架构是一件既耗费成本又风险极高的事情,所以英伟达必须保证自己设计的处理器足够优秀,否则几年的努力便都灰飞烟灭了。
32位K1的技术细节
从技术细节上来看,英伟达在Tegra K1上的改动可谓大刀阔斧,采用7发射超标量执行体系,非对称一级缓存,64-bit指令集架构,等等,但改动归改动,这些并不能为处理器带来决定性的效率提升。很大部分因素还是在于英伟达以及未来的应用开发者在软件上的优化才能实现。
“动态核心优化”(Dynamic Code Optimization)是英伟达为K1配备的一项“黑科技”,它能将频繁使用的软件程序转换成高度优化的微代码等价程序,并为此配备了独立的、基于主内存的128MB优化缓存。简而言之,这是一项可以明显提升处理器性能的新技术。该技术才是我们最值得关注的点。
说了这么多,那么64位Tegra K1的性能到底如何,让我们通过跑分一探究竟吧。
K1跑分单线程多线程跑分对比(图片来自appleinsider)
从图中的跑分可以看出,单核Tegra K1的跑分几乎和单核苹果A8X持平,但由于苹果采用三核心设计,所以在多线程跑分中,苹果明显胜出。
人家都八核了,高大上的K1为什么还采用双核?
要想解释清这个问题,我们先要明白多核处理器并不能自己决定运行哪个程序的什么指令,所以如何分配任务给每一个核心是多核处理器最核心的问题。
根据笔者采访业内人士了解到,任务在不同核心之间切换需要透过cache,处理器的cache带宽本来就捉急,再拿来分配给不同核心任务完全就是给自己添堵。而且这个过程还不是说轻松愉快的想在某个线程当中插一个指令就可以分配给其它核心那么简单,你必须在转移核心时把整条线程全端到新核心上去,这对执行过程和编程都是灾难性的。
结论是,目前很多厂商生产超多核心芯片的目的是“性能不够,核心凑”,从而增加产品买点。所以在这里提醒读者,不要盲目相信多核心便会拥有更强性能。
如果想要证明过多的核心并不代表性能一定强劲,我们只要看看苹果的处理器就可以了。当业界已经将8核当作主流配置的时候,苹果还在用双核处理器。两个核心数虽然不多,但相对便于编程者对软件的优化则要轻松很多,所以苹果设备的使用体验并不比配备8核处理器的产品差。因为再强悍的处理器,如果缺少软件的优化,那也只是泛泛之辈。
64位K1的两颗超级核心面积明显比32位K1四加一核心的面积更大,技术优势非常明显
所以,与其增加处理器的核心数,不如在处理器的设计上下功夫,并利用软件优化来实现理想的运行效果。而64位的Tegra K1便是这样做的。我们可以从上图看到,尽管相比32位K1少了两颗核心,但64位K1的处理器面积明显更大,内部设计更精密。
当然,我们依然要说,自行设计处理器不仅烧钱,而且风险极高。
总结来说,对于该芯片处理部分我们应该明白:
1:尽管这是一颗双核芯片,但它的技术以及性能不亚于市面上的4核乃至8核处理芯片。
2:所谓期望越大失望越大,尽管该芯片拥有7发射超标量执行体系,非对称一级缓存,64-bit指令集架构,但性能提升紧限于理论层面,而并不是绝对性能的提升。
3:“动态核心优化”(Dynamic Code Optimization)是英伟达为K1配备的一项“黑科技”,值得关注
4:64位Tegra K1是英伟达“丹佛计划”的一个开始,一个初代产品。
推荐经销商