随着gtx 1070 ti显卡的紧急亮相,英伟达16nm pascal家族已经完全完成了历史使命,下一代将是12nm volta伏特。虽然游戏卡要等到明年春天,但在高性能计算领域,新架构、新内核的特斯拉v100已经出现,并逐渐打开局面。
在此之前,谷歌部署了特斯拉p100,这是一种基于帕斯卡架构的计算卡,现在亚马逊已经将新的特斯拉v100用于自己的aws云服务。
特斯拉v100拥有5120个cuda内核和640个张量辅助内核,面积815平方毫米,集成210亿个晶体管,半精度30次浮点、单精度15次浮点和双精度7.5次浮点的浮点性能,120次浮点和16gb hbm2高带宽内存的张量深度学习性能。
相比之下,特斯拉p100内置3584流处理器,单精度浮点性能刚好接近10次浮点,没有专门从事神经网络训练和推理的张量核。
亚马逊以三种不同的方式部署特斯拉v100,即单向、四向和八向(后两种通过nvlink总线互联),每种方式都有64gb、256gb和512gb的系统内存。
标题:[科技资讯] 亚马逊部署NVIDIA Tesla V100计算卡:八路并联
地址:http://www.heliu2.cn/xw/4173.html