NVIDIA发布PCI-E Tesla V100
5月份的GTC大会上,NVIDIA正式宣布了新一代GPU架构“Volta”,依然首先用于高性能计算领域,首发产品是款强大的计算卡Tesla V100,采用NVIDIA独有的SXM2造型规格。
今天的ISC国际超算大会上,NVIDIA又发布了一款Tesla V100,而这用的是传统PCI-E造型规格,好处是兼容性更佳,可以直接放入现有服务器系统,坏处就是规格和性能有点损失。
Tesla V100基于台积电12nm FFN(16nm加强版)工艺制造的GV100大核心,拥有5120个CUDA核心、640个Tensor核心,面积达815平方毫米,集成了210亿个晶体管。
SXM2版本的核心加速频率为1455MHz,浮点性能半精度30TFlops、单精度15TFlops、双精度7.5TFlops,Tensor深度学习性能则有120TFlops。
PCI-E版的加速频率降低到了约1370MHz,降低了6%,浮点性能半精度28TFlops、单精度14TFlops、双精度7TFlops,Tensor深度学习性能则有112TFlops。
不过显存规格没变,都是搭配4096-bit位宽的16GB HBM2,频率1.75GHz,带宽900GB/s。
PCI-E版的热设计功耗也从300W降低到了250W,依然是被动散热。
PCI-E Tesla V100将在年底上市,慧与科技(HP Enterprise)就会提供多套系统。
AMD首款Vega卡 Instinct MI25规格确认
去年年末,AMD为我们带来了首款采用Vega架构的加速卡——Radeon Instinct MI25,该卡比起Pascal架构的Tesla P100,在浮点运算、功耗上都要略胜那么一点点。现在,AMD正式公布了MI25的规格,连同更低阶的MI8和MI6一起。
Instinct MI25加速卡主力服务于深度学习领域,拥有64个NCU计算单元总计4096个流处理器,FP16半精度浮点运算性能为24.6 TFLOPs,FP32单精度浮点性能为12.3 TFLOPs,搭载HBM2显存,容量为16GB,带宽484GB/s,TDP为300W。根据单精度浮点运算性能推算,该卡的核心频率为1500MHz,低于Radeon Vega Frontier Edition专业卡。
Instinct MI8采用的是GCN 1.2架构的Fiji核心,SFF小尺寸设计,拥有64个CU计算单元总计4096个流处理器,FP32单精度浮点性能为8.2 TFLOPs,搭载HBM显存,容量为4GB,带宽512GB/s,TDP为175W,核心频率为1000MHz。
Instinct MI6采用的是上代的Polaris核心,拥有36个CU计算单元总计2034个流处理器,FP32单精度浮点性能为5.7 TFLOPs,搭载GDDR5显存,容量为16GB,带宽224GB/s,TDP为150W,核心频率为1237MHz。
其实这次的正式确认并未带来什么新消息,只是将之前公布的一些参数更精确化了,既然已经正式确认,相信有需求的用户很快就可以买到这款产品了。
本文属于原创文章,如若转载,请注明来源:DIY周报:苹果A10X处理竟能干翻i7!//diy.zol.com.cn/644/6444591.html
推荐经销商