中关村在线消息:在2015年4月15日英伟达在北京的媒体分享会上表示,相较于当前的Maxwell处理器,NVIDIA预计于明年推出的Pascal架构GPU将使深度学习应用中的计算速度加快十倍。
NVIDIA 下一代 Pascal GPU 架构将在深度学习应用中的计算速度加快十倍
深度学习指的是计算机使用神经网络自主学习的过程,这个趋势的兴起让 NVIDIA 又进一步改进了原本在去年GTC 即公布的Pascal 架构设计内容。
Pascal架构GPU的三大设计特色将大幅加快训练速度,精准地训练更丰富的深度神经网络,犹如人类大脑皮层的资料结构将成为深度学习研究的基础。再加上32GB的显存(是NVIDIA新发布的旗舰级品GeForce GTX TITAN X的2.7倍),Pascal架构可进行混合精度的计算任务。它将配备3D堆叠显存,提升深度学习应用程序的速度性能多达5倍;另搭配NVIDIA的高速互连技术NVLink来连接两个以上的GPU,可将深度学习的速度提升达十倍。
在关键深度学习的任务方面,Pascal 架构的性能表现优于 Maxwell 架构
混合精度计算–达到更精准的结果
混合精度计算让采用Pascal架构的GPU能够在16位浮点精度下拥有两倍于32位浮点精度下的速率的计算速度。更出色的浮点计算性能特别提高了深度学习两大关键活动:分类和卷积的性能,同时又达到所需的精准度。
3D堆叠显存–更快的传输速度和优秀的省电表现
显存带宽限制了数据向GPU传输的速度。采用3D堆叠显存将可提高比Maxwell架构高出三倍的带宽和近三倍的容量,让开发人员能建立更大的神经网络,大大提升深度学习训练中带宽密集型部分的速度。
Pascal采用显存芯片逐个堆叠的技术,位置接近GPU而不是处理器板更往下的地方。如此就能把输出在显存与GPU间往返的距离从几英寸减缩到几毫米,大幅加快传输速度和拥有更好的省电表现。
NVLink – 更快的数据移动速度
Pascal架构加入NVLink技术将使得GPU与CPU之间数据传输的速度,较现有的PCI-Express标准加快5到12倍,对于深度学习这些需要更高GPU间传递速度的应用程序来说是一大福音。NVLink可将系统里的GPU数量增加一倍,以共同用于深度学习计算任务上;还能以新的方式连接CPU与GPU,在服务器设计方面提供较PCI-E更出色的灵活性和省电表现。
关于NVIDIA® (英伟达™) 公司
NVIDIA新闻中心:【点我进入】
NVIDIA新浪微博:【点我进入】
NVIDIA腾讯微博:【点我进入】
NVIDIA官方微信:NVIDIA_China
自从1993年以来,NVIDIA(纳斯达克代码: NVDA) 一直在视觉计算的艺术与科学发展中勇当开路先锋。NVIDIA公司的诸多技术正在彻底转变显示世界的面貌,使其成为充满互动与探索的世界,这将影响所有人,不论是游戏玩家、科学家还是消费者或者是企业客户。
推荐经销商