在GPU界,后发制人的情况非常常见,虽然不是绝对,但只要技术允许,AMD和NVIDIA都不会让各自晚发布的产品弱于对手早发布的产品,那样不仅业内人士会讽刺调侃,广大的消费者也不会买账。就在几个月前,AMD正式发布了迟来的旗舰Radeon RX Vega 64/56,其中次旗舰RX Vega 56以绝对的优势胜过了NVIDIA于去年5月发布的GTX 1070,践行了后来者居上的“潜规则”。
然而,一向以引人瞩目的霸者姿态亮相的NVIDIA怎么甘心被老对手领先,于是在北京时间上周四晚九点,NVIDIA正式发布了采用GP104-300新核心的次旗舰新卡——GeForce GTX 1070 Ti,该卡的诞生有且只有一个目的,那就是击败领先GTX 1070的RX Vega 56。熟悉显卡的DIY玩家们应该都清楚,这是NVIDIA首次在“GTX X70”显卡中引入“Ti”,这样所有GeForce GTX显卡就都有对应的“Ti”版本出现了。
GTX 1070 Ti的定位其实还挺尴尬的,按名称其性能应该介于GTX 1070和GTX 1080中间,而RX Vega 56的性能恰好卡在前面两张卡中间,GTX 1070 Ti要想超过RX Vega 56,就会十分接近GTX 1080,这势必会影响GTX 1080的销量,所以控制起来会很难。不过“两弹元勋”老黄一向以“刀法精湛”著名,他还真就做到了让GTX 1070 Ti的性能既不威胁到GTX 1080,又能胜过RX Vega 56。
老黄的精准控制体现在以下三点:1、GTX 1070 Ti的流处理数量仅比GTX 1080少128个,这是很少见的,一般来说精简掉256个流处理器是比较常见的做法,128个处理器带来的只有不到5%的性能差距;2、GTX 1070 Ti使用的是GDDR5显存,而GTX 1080使用的是GDDR5X显存,两者在带宽上有着25%的差距;3、为了彻底除掉GTX 1070 Ti越位的可能性,NVIDIA将其频率锁定在1607-1683MHz,并且不允许厂商改变自家非公版的频率。
于是,号称RX Vega 56杀手的GTX 1070 Ti就这样诞生了,既然老黄如此设计,那么基本上可以确定后者是要强于前者的,可是后者是否能够做到全面超越,究竟强于前者多少还是个未知数,因此接下来的首测部分,我将通过十余项软件和游戏测试来对GTX 1070 Ti的性能进行全面的展示和剖析。为了精确体现这款卡的实力,吉吉我选择了一块公版GTX 1080以及一块公版RX Vega 56作为主要对比对象,那么接下来就让我们一起看看Pascal家族最后的旗舰级显卡会有怎样的实力。
GTX 1070 Ti Founders Edition开箱视频
小割一刀的GP104
GeForce GTX 1070 Ti采用全新16nm制程的Pascal架构,核心代号为GP104,具体型号为GP104-300-A1,而GTX 1080的核心代号为GP104-400-A1。GP104核心面积约为314平方毫米,核心内集成了72亿晶体管,是GTX 980晶体管数量的1.38倍,核心面积却仅为GTX 980的78.9%。
GP104-300-A1核心
基于Pascal架构的GP104-300芯片运算资源总量为2432个ALU,比完整的GP104-400仅少了128个CUDA核心。GP104-300的TMUs数量为152个,后端的ROPs数量为64个,4个带宽为64bit的双通道内存控制器组成了总量为256bit的显存控制单元,大小为8GB。由于其采用了常规的GDDR5显存,所以其带宽比GTX 1080低了20%,为256GB/s。
显 卡 规 格 比 较 表 | ||||
显卡型号 | GTX 1070 Ti | RX Vega 56 | GTX 1080 | GTX 1070 |
首发限价 | ¥3499 | ¥4199 | ¥5399 | ¥3499 |
GPU代号 | GP104-300 | Vega 10 XT | GP104-400 | GP104-200 |
GPU工艺 | 16nm | 14nm | 16nm | 16nm |
GPU晶体管 | 7.2B | 12.5B | 7.2B | 7.2B |
着色器数量 | 2432 | 3584 | 2560 | 1920 |
单精度浮点 | 8.1 T | 10.5 T | 9 T | 6.5 T |
ROPs数量 | 64 | 56 | 64 | 64 |
纹理单元数量 | 152 | 256 | 160 | 120 |
核心频率 | 1607 MHz | 1156 MHz | 1607 MHz | 1506 MHz |
boost频率 | 1683 MHz | 1471 MHz | 1733 MHz | 1683 MHz |
TDP | 180W | 210W | 180W | 150W |
显存频率 | 2000 MHz | 800 MHz | 1250 MHz | 2000 MHz |
内存位宽 | 256 bit | 2048 bit | 256 bit | 256 bit |
内存带宽 | 256 GB/s | 410 GB/s | 320 GB/s | 256 GB/s |
内存类型 | GDDR5 | HBM2 | GDDR5X | GDDR5 |
内存容量 | 8 GB | 8 GB | 8 GB | 8 GB |
注:表中售价均为官方首发限价
我们可以看到,GTX 1070 Ti的默认核心频率为1607MHz,与GTX 1080相同,Boost频率为1683MHz,与GTX 1070相同,这种设定巧妙地限制了GP104-300芯片的发挥。GTX 1070 Ti的默认Texture Fillrate能力为244.3Gtexels/S,照比GTX 1070升高了不少。
凭借高频和庞大的运算规模,GTX 1070 Ti拥有8.1 TFLOPS的高单精度浮点运算能力,照比GTX 1070提升了24.6%,提升幅度很大,但照比RX Vega 56的10.5T还是有不小差距。其优势之处在于,GTX 1070 Ti的TDP同GTX 1080相同,比对手RX Vega 56低了30W,因此理论上一个单8pin辅助供电接口就可以完全符合其电量需求。
Pascal架构GP104-300芯片由以下主要的部分组成:
1、基于TSMC的16nm FinFET Plus工艺。
2、4单元的宏观并行结构,20组SM单元被分为4个GPC,每个GPC包含5组SMs,但砍掉了1组SM单元,因此总量为19个。
3、19组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SM单元。每个SM单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
4、GP104-300拥有8个32位显存控制器,总计256位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计64个ROPs单元和2048KB二级缓存。
5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
显卡拆解赏析
相信关注我们显卡频道的诸位看官已经看过太多次NVIDIA GeForce Founders Edition的拆解了,可总有人没看过,所以我们还是再回顾一下Founders Edition的设计吧:
散热器设计
GTX 1070 Ti Founders Edition采用公版标配的涡轮散热器,涡轮将热空气经I/O区散热孔中吹出,涡轮扇的最大转速被限制在51%,也就是2050转左右。
GTX 1070 Ti Founders Edition上搭载了Pascal这代全新设计的背板,在组建SLI平台时,可以卸掉一半背板来增加气流量,以此来增强散热效果。
真空腔均热板散热模块
GTX 1070 Ti Founders Edition搭载了和GTX 1080 Ti一样的真空腔均热板,散热效果显著,可以轻松压制250W的TDP。
GTX 1070 Ti Founders Edition的全金属中框既可以加固显卡,又可以起到一定的辅助散热作用,在中框上贴有导热垫,辅助显存等高发热部位散热。显卡搭载的涡轮扇十分静音,即使在高负载情况下,风噪声也不是很明显。
与GTX 1080 Founders Edition相比,GTX 1070 Ti的元器件布局及数量基本一致,目测仅右侧少了一颗电容,可见两张卡的差距真的很小。
GTX 1070 Ti Founders Edition的供电设计采用了和GTX 1080一样的的5+1相双FET,就料件的品质来说,高品质贴片电感、钽电容等高档元器件是没什么值得挑剔的。
GTX 1070 Ti Founders Edition上的芯片是微微精简的GP104游戏核心,代号为GP104-300-A1。
GTX 1070 Ti Founders Edition采用单8pin辅助供电接口,同GTX 1080一致,加上PCI-E最大可提供225W功率,足够显卡在高频下稳定工作,并且有着一定的超频能力。
GTX 1070 Ti Founders Edition拥有DVI-D+HDMI+3*DP的全接口组合,与GTX 1080一致,完美兼容市面上各类显示器。
非公版显卡一览
iGame GTX1070Ti Vulcan X Top
华硕 ROG STRIX GTX1070Ti 8G GAMING
华硕 ROG STRIX GTX1070Ti 8G GAMING
测试平台环境一览
为保证测试能够发挥显卡的最佳性能,本次测试平台采用Intel酷睿i7-7700K处理器、技嘉Z270芯片组主板、阿斯加特DDR4-2133 32GB双通道内存、安钛克1000w钛金电源组建而成。详细硬件规格如下表所示:
测 试 平 台 软 硬 件 配 置 | ||
核心配件 | ||
CPU | Intel | 酷睿i7-7700K |
主板 | 技嘉 | GA-Z270X-Gaming 9 |
核芯显卡 | Intel | HD 630 |
内存 | 阿斯加特 | LEORICE DDR4-2133 32GB x2 |
硬盘 | 浦科特 | PX-512M6S+ |
电源 | 安钛克 | HCP 白金版-1000 |
系统及驱动程序 | ||
操作系统 | Microsoft Windows 10 | |
主板驱动 | Intel芯片组驱动 | |
显卡驱动 | NVIDIA GeForce Game Ready Driver(388.09 Beta) | |
DirectX环境 | DirectX 12 | |
帧数监控 | Fraps 3.5.1 |
测试用主板:技嘉GA-Z270X-Gaming 9
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark或Fraps来衡量性能,数值同样越高越好。
理论性能测试:3DMark FireStrike
首先进行的是用来衡量显卡理论DX11性能的3DMark FireStrike测试,选择模式为Extreme,对应的是2K分辨率,测试结果如下:
3DMark FSE GPU成绩
在3DMark FireStrike Extreme测试中,GTX 1070 Ti表现亮眼,得分仅比GTX 1080低约6.9%,超过GTX 1070约14.9%,超过对手RX Vega 56约5.5%,可谓是恰到好处的领先。接下来我们测试一下该卡的理论DX12性能,使用的是3DMark Time Spy,对应的同样是2K分辨率,结果如下:
在3DMark Time Spy测试中,GTX 1070 Ti表现得更为出色,得分比GTX 1080低约4.4%,超过GTX 1070约16.6%,超过对手RX Vega 56约13.4%,性能十分强劲。最后我们来测试一下显卡的VR性能,使用的是SteamVR Performance Test,测试结果如下:
在VR测试中,GTX 1070 Ti的保真度达到了满分的11,已测试帧数达到了14256帧,而对手RX Vega 56的保真度为10.8,已测试帧数为10407,前者优势较为明显。综上所述,GTX 1070 Ti在所有基准测试中均超过对手RX Vega 56,照比GTX 1080的差距也仅有5%左右,表现十分亮眼。
DX12游戏性能测试
在游戏性能测试环节,我们选取了4款DX12游戏和4款DX11游戏进行测试,测试分辨率为1080p、2K和4K。在测试中将所有游戏的特效设置为最高,关闭垂直同步,选用适当的抗锯齿,用游戏内自带benchmark或Fraps记录下平均帧数,首先是DX12游戏的测试,结果如下:
《杀手6》帧数对比
首先是《杀手6》的游戏帧数对比,从结果可以看出,GTX 1070 Ti在2K分辨率领先RX VEGA 56约4.3%,落后GTX 1080约4.1%;在4K分辨率下,GTX 1070 Ti领先RX VEGA 56约11.2%,落后GTX 1080约4.9%。
在《古墓丽影:崛起》的测试中,GTX 1070 Ti在2K分辨率领先RX VEGA 56约14.6%,落后GTX 1080约4%;在4K分辨率下,GTX 1070 Ti领先RX VEGA 56约11.4%,落后GTX 1080约8.3%。
在《战锤:全面战争》的测试中,GTX 1070 Ti在2K分辨率领先RX VEGA 56约4.4%,落后GTX 1080约4.1%;在4K分辨率下,GTX 1070 Ti领先RX VEGA 56约7.6%,落后GTX 1080约4.8%。需要说明的是,最近该作更新了内置的benchmark程序,新程序场景更为复杂,所以测试帧数照比之前降低许多。
在《杀出重围:人类分裂》的测试中,GTX 1070 Ti在2K分辨率领先RX VEGA 56约15.1%,落后GTX 1080约8.2%;在4K分辨率下,GTX 1070 Ti领先RX VEGA 56约4.3%,落后GTX 1080约9%。
总结一下,在DX12游戏测试中,GTX 1070 Ti的综合表现正好卡在GTX 1080和RX VEGA 56之间,平均下来在2K/4K下分别领先RX VEGA 56约9.6%/8.6%,落后GTX 1080分别为5.1%/6.8%,控制得可谓是相当精准。
DX11游戏性能测试
测试完四款卡的DX12游戏性能,我们再来看一下它们在DX11游戏中的表现,最终测试结果如下:
《全境封锁》帧数对比
首先是《全境封锁》的游戏帧数对比,从结果可以看出,GTX 1070 Ti在2K分辨率领先RX VEGA 56约8.2%,落后GTX 1080约2.8%;在4K分辨率下,GTX 1070 Ti领先RX VEGA 56约7%,落后GTX 1080约4.8%。
《孤岛惊魂:原始杀戮》帧数对比
接下来是《孤岛惊魂:原始杀戮》的游戏帧数对比,GTX 1070 Ti在2K分辨率领先RX VEGA 56约6.3%,落后GTX 1080约5.6%;在4K分辨率下,GTX 1070 Ti领先RX VEGA 56约2.7%,落后GTX 1080约7.3%。
在《蝙蝠侠:阿甘骑士》的测试中,GTX 1070 Ti在2K分辨率领先RX VEGA 56约3.3%,落后GTX 1080约4%;在4K分辨率下,GTX 1070 Ti领先RX VEGA 56约4%,落后GTX 1080约5.5%。
最后我们看一下各卡在网游中的表现。在《守望先锋》的测试中,GTX 1070 Ti在2K分辨率领先RX VEGA 56约27%,落后GTX 1080约5.1%;在4K分辨率下,GTX 1070 Ti领先RX VEGA 56约14.8%,落后GTX 1080约10.1%。
综上所述,在DX11游戏测试中,除暴雪的N卡向游戏《守望先锋》外,GTX 1070 Ti的综合表现依旧卡在GTX 1080和RX VEGA 56之间,平均下来在2K/4K下分别领先RX VEGA 56约5.9%/4.6%,落后GTX 1080分别为4.1%/5.9%。
双卡SLI性能测试
测试过单卡后我们来看看双卡SLI的性能。由于篇幅和时间所限,我们选择的测试项目只是3DMark FireStrike Extreme及Time Spy,使用NVIDIA GeForce GTX SLI HB Bridge连接两块GTX 1070 Ti,测试结果如下图:
3DMark FSE GPU成绩为17739分
首先是测试DX11理论性能的FireStrike Extreme,在该项测试中GTX 1070 Ti SLI平台的GPU得分为17739分,比GTX 1070 Ti单卡得分提升了85.4%,比GTX 1080 Ti单卡高了31.1%,SLI效率较高。
之后是测试DX12理论性能的Time Spy,在该项测试中GTX 1070 Ti SLI平台的GPU得分为13021分,比GTX 1070 Ti单卡得分提升了90.4%,比GTX 1080 Ti单卡高了38.8%,SLI效率比DX11下更高。
有关GTX 1070 Ti双卡SLI平台游戏性能的评测,我会在不久的将来为大家呈现,请大家拭目以待。
显卡功耗及温度测试
温度方面我们将继续采用FurMark来进行测试,让GPU芯片之中每一个运算单元完全满载,充分发挥供电最大化的状态。我将参数设定为1280*1024分辨率,开启8*MSAA。烤机约15分钟,各卡满载温度如下:
显卡烤机温度对比
从以上结果可以看出,温度最高的为GTX 1080,烤机温度高达83℃,比GTX 1070 Ti高了6℃。RX VEGA 56的表现最好,比GTX 1070 Ti还要低2℃,不过为了压制更高的功耗,其风扇噪音要远大于后者,三款卡中在平衡噪音及温度方面做得最好的是GTX 1070 Ti。
待机功耗方面,所有参测显卡所在平台的功耗均在70w左右,这说明在空载状态下,参测显卡的耗电程度是差不多的;而满载平台功耗方面,TDP同为180W的GTX 1070 Ti和GTX 1080却略有不同,前者比后者低了约13W,而TDP最高的RX VEGA 56功耗自然也是最高,比GTX 1070 Ti高了47W。
精准控制下的胜利
以上就是本次首测的全部内容,GTX 1070 Ti正如我们所期待的,在所有游戏和基准测试中均全面领先RX Vega 56。基准测试中,GTX 1070 Ti领先RX Vega 56约9%,而从游戏帧数来看,GTX 1070 Ti几乎可以在所有单机大作中做到2K下特效全开完美运行,除了《杀出重围:人类分裂》这种优化成问题的显卡杀手级游戏。同RX Vega 56相比,其在所有游戏中均保持领先,平均领先幅度在5%-10%之间。
NVIDIA GeForce GTX 1070 Ti
GTX 1070 Ti不仅在性能上优势明显,功耗表现上也是高对手一头,其平台满载功耗实测比RX Vega 56低了足足47W,因此从能耗比的角度来说,GTX 1070 Ti可以说是全面压制RX Vega 56。温度方面,GTX 1070 Ti满载温度略逊于RX Vega 56,但噪音要比后者小不少,在实际使用体验上自然也是更胜一筹。
前文说到,GTX 1070 Ti既要做到赢过对手RX Vega 56,又不能超过GTX 1080,从测试结果来看,其在基准测试中弱于GTX 1080约6%,游戏测试中弱于GTX 1080约5%,可谓是完美地完成了任务。有一点需要说明,NVIDIA虽然限定了各家AIC生产的显卡的频率,但这并不代表GTX 1070 Ti没有超频能力,在GPU Boost 3.0的帮助下,GTX 1070 Ti FE版的频率可高至1.9GHz,如果你会用软件超频,想要冲击更高频率也是可以的。
面对来势汹汹、占尽上风的GTX 1070 Ti,AMD这边也紧急应战:在双11期间,AMD将旗下各品牌RX VEGA 56公版的价格下调至3599元,而蓝宝石和迪兰还有晒单返500元京东E卡的活动,实付3099元到手。这个价格已经比市面上绝大多数非公版GTX 1070还要低了,而非公版GTX 1070 Ti的价格区间为3499-4399元,因而在性价比上两款卡算是做到了旗鼓相当。
我们此次首测所使用的是GTX 1070 Ti Founders Edition,相信很多网友都很喜欢这信仰满满的造型,不过遗憾的是,该卡同GTX 1060 Founders Edition一样,在国内是不对外销售的,仅仅作为媒体评测卡使用,因而大家只能选择AIC的非公版产品。由于此次各家非公版GTX 1070 Ti的频率都是相同的,所以玩家们肯定很好奇各款卡有没有性能上的差距,所以在首测发布的同一时间,吉吉我也为大家带来了我们收到的首款非公版显卡——iGame GTX1070Ti Vulcan X Top的同步评测,大家可以点击超链接跳转到该卡的单品评测,看看非公版照比公版会强在哪里。
一晃就到了2017年年底,GTX 1070 Ti作为Pascal家族最后一员,为GTX 10系列显卡画上了一个完美的休止符。回顾一整年,NVIDIA接连发布了3款旗舰级产品和1款入门级产品,而AMD这边则是发布了4款Polaris 20显卡,和2款迟来的RX Vega旗舰卡,两家的新制程之战从去年年中一直延续到现在,至此也算是告一段落了。明年开始将会是Volta和Vega 20的角逐,有消息称两家将用上10nm制程,大战一触即发。这场好戏将会如何上演?就让我们拭目以待吧!