GP102-350核心解析
GeForce GTX 1080 Ti采用全新16nm制程的Pascal架构,核心代号为GP102,具体型号为GP102-350-K1-A1,而NVIDIA TITAN X的核心代号为GP102-400-A1。GP102核心面积约为471平方毫米,得益于16nm的制程优势,核心内集成了12亿晶体管,是GTX 980 Ti晶体管数量的1.5倍,核心面积却仅为GTX TITAN X的78.4%。
显 卡 规 格 比 较 表 | ||||
显卡型号 | NVIDIA TITAN X | GTX 1080 Ti | GTX 1080 | GTX 980 Ti |
首发限价 | \$1200 | \$699 | \$699 | \$649 |
GPU代号 | GP102 | GP102 | GP104 | GM200 |
GPU工艺 | 16nm | 16nm | 16nm | 28nm |
GPU晶体管 | 12B | 12B | 7.2B | 8B |
着色器数量 | 3584 | 3584 | 2560 | 2816 |
单精度浮点 | 11 T | 11.5 T | 9 T | 6.4 T |
ROPs数量 | 96 | 88 | 64 | 96 |
纹理单元数量 | 224 | 224 | 160 | 176 |
核心频率 | 1418 MHz | 1480 MHz | 1607 MHz | 1000 MHz |
boost频率 | 1531 MHz | 1582 MHz | 1733 MHz | 1075 MHz |
架构 | Pascal | Pascal | Pascal | Maxwell 2 |
显存频率 | 1251 MHz | 1376 MHz | 1250 MHz | 1753 MHz |
内存位宽 | 384 bit | 352 bit | 256 bit | 256 bit |
内存带宽 | 505 GB/s | 484.4 GB/s | 320 GB/s | 336.5 GB/s |
内存类型 | GDDR5X | GDDR5X | GDDR5X | GDDR5 |
内存容量 | 12 GB | 11 GB | 8 GB | 6 GB |
注:表中售价均为官方首发限价
基于Pascal架构的GP102-400芯片运算资源总量为3584个ALU,于GP102-400相同;GP102-350的TMUs数量为224个,后端的ROPs数量为88个,5个带宽为64bit的双通道显存和1个带宽为32bit的单通道内存控制器组成了总量为352bit的显存控制单元,大小为11GB。同NVIDIA TITAN X相比,其各项参数基本相同,不过显存位宽下降32-bit,显存带宽从505GB/s下降至484GB/s,ROPs单元数量也下降了8个。
GP102-350架构图
我们可以看到,GTX 1080 Ti的默认核心频率为1480MHz,Boost频率为1582MHz,比NVIDIA TITAN X的频率要高出60MHz左右,其中显存频率提升较大,由于G5X显存升级换代,等效频率提高了足足1GHz,因此单精度浮点运算性能比后者还要高出0.5 TFLOPS。GTX 1080 Ti的默认Pixel Fillrate能力达到了142.2Gpiexls/S,默认Texture Fillrate能力为331.5Gtexels/S,照比NVIDIA TITAN X均有所降低。最后需要说明的是,在TDP相同的情况下,GTX 1080 Ti拥有11.5 TFLOPS的超高单精度浮点运算能力,照比GTX 980 Ti提升了80%,能耗比惊人,为目前单精度浮点运算性能最高的单芯游戏显卡。
Pascal架构GP104-350芯片由以下主要的部分组成:
1、基于TSMC的16nm FinFET Plus工艺,相比28nm HPM提升了65%的性能或者减少了70%的能耗,同时晶体管密度翻倍。
2、6单元的宏观并行结构,30组SMs单元被分为6个GPC,每个GPC包含5组SMs,但砍掉了2组SMs单元,因此总量为28个,相对应地,纹理单元缩减为224个。
3、28组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
4、GP102-350拥有11个32位显存控制器,总计352位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计88个ROPs单元和2816KB二级缓存。
5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
本文属于原创文章,如若转载,请注明来源:撞破烟楼寻极致 GTX 1080 Ti首发测试//diy.zol.com.cn/630/6300698.html