01 Inno3D RTX 3070冰龙超级版评测
产品:Inno3D GeForce RTX 3070冰龙超级版 映众 显卡自从RTX 30系显卡发布以来,显卡性能榜又再一次被重新改写。搭载NVIDIA Ampere架构的GEFORCE RTX3090/3080凭借着飙悍性能成功占据目前的卡皇宝座。其中定位最低的EFROCE RTX 3070也作为第三款RTX30系列显卡出场,凭借性能和价格的双重优势,无疑会成为玩家心中最合适的游戏高端显卡。虽然目前阶段是30系显卡的“入门卡”,但是GEFROCE RTX 3070拥有媲美上代卡皇RTX2080TI的性能表现。而非公版在对散热和性能的优化上就更为出色了,比如我手中的主角——Inno3D GeForce RTX 3070冰龙超级版。
Inno3D GeForce RTX 3070冰龙超级版
在评测开始前,笔者为大家总结一些该显卡的特点,也方便大家有针对性的阅读:
①搭载全新8nm的NVIDIA Ampere架构以及GDDR6显存,性能大幅度提升;
②四风扇七热管超壕配置,有效控温;
③RGB酷炫灯箱,支持软件设置 ,支持主板炫光同步;
④接口全镀金设计 ,有效抗氧化;
Inno3D GeForce RTX 3070冰龙超级版显卡外观设计非常的硬朗,金属枪灰色和黑色的碰撞拼接设计,彷佛在身上装配了战甲。映众GeForce RTX 3070冰龙超级版显卡除了常见的三风扇以外还在顶部搭载了一个小风扇,这种设计可以有效的为显卡和供电散热,保证显卡稳定的运行环境。
风扇的位置位于显卡侧面,我们在安装显卡的时候正好位于机箱侧面。正常是全黑屏,看上去比较沉稳低调,但是一旦点亮就是另一番世界了。这块大尺寸的RGB灯箱能给你带来不一样的灯效感受。通过内置MCU芯片控制,预设多种灯效供玩家个性化设置,同时还会随包装赠送同步线,可支持多种灯光同步。Inno3D针对RTX30系列显卡也推出了全新的灯控界面,可以实现多种个性化的炫酷灯效,帮助玩家打造自己的个性化显卡。
所以如果你的机箱有透明侧板,或者你是一个喜欢灯光的玩家。相信你一定会对这款显卡爱不释手的。让我们再来实际看一下机箱中的灯效变化。
Inno3D GeForce RTX 3070冰龙超级版灯效
是不是有一种赛博朋克的风格?看完小风扇我们再来看看正面的大风扇,3个92mm镰刀形风扇整齐安置在显卡正面,配合棱角分明的显卡外形有一种来自未来的科技感。
既然叫做超级冰龙,在散热方面自然有自己的独到之处,RTX 3070冰龙超级版的散热配置采用6+1热管的组合,顾名思义这其中的6根热管是给GPU散热的,而另外的热管是为供电模块单独设计,也就是配合我们侧面灯箱上小风扇对显卡进行全方位的散热,值得一提的是热管采用超密挤压工艺,确保每根热管都能与GPU接触到,配合我们刚刚提到四风扇能够有效提升热量传导性能,稳定控温。
显卡背面就是一体式金属背板,这种一体式的背板可以有效的辅助PCB散热,同时上面的镂空设计和尾部的风道也避免了因为风阻造成的热量累计。在散热的的同时也让显卡整体的外观也加分不少。
Inno3D GeForce RTX 3070冰龙超级版基于NVIDIA公版方案,配备了10+2相供电,电源部分显卡采用双8Pin接口设计 ,这款显卡外接双8Pin的电源接口,对于玩家使用上来说更加的方便;在这里推荐使用600W以上的电源,如果你之前的电源不到600W,这个时候可能真的需要升级了!
在视频输出接口上,映众GeForce RTX 3070冰龙超级版显卡采用DP*3+HDMI 2.1的4接口设计,充分满足用户的扩展需求;另外由于本次HDMI 2.1的升级,该接口可支持单线8K的视频输出;同时接口上还采用了镀金设计,不易被氧化,有效延长接口的寿命。
NVIDIA Ampere架构下的3070
映众GeForce RTX 3080冰龙超级版采用了NVIDIA Ampere架构,在对显卡进行测试之前,我们首先来了解一下30系显卡的架构问题,比较一下相对于上一代20系显卡的提升。
相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3070中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3070的着色器性能达到20.3 TFLOPS单精度性能,而Turing为7.9 TFLOPS。
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到39.7 RT TFLOPS,而Turing为23.8 RT TFLOPS。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达162.6 Tensor TFLOPS,而Turing为60.3 Tensor TFLOPS。
RTX 3070的GPU核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3070中我们都知道仍然采用了GDDR6显存,不过不同于RTX 3080的Micron,RTX 3070采用了三星的GDDR6显存。
我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
RTX 3070共有5888个CUDA,其实它只有2944个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了5888这个惊人的数字。
而这样粗暴的提升CUDA数量对于游戏有帮助吗?答案是有,不仅有提升还很大。其实通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
3D MARK理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥Inno3D GeForce RTX 3070冰龙超级版显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,Inno3D GeForce RTX 3070冰龙超级版采用了GA104核心,三星8nm,芯片面积392平方毫米,相比RTX 3080的628小了236平方毫米,拥有5888个CUDA,频率为1500-1785MHz,而公版为1725MHz,从非公的基本参数来说,属于超公版的水平。显存方面与20系显卡相同,采用了8GB GDDR6显存,位宽为256bit,显存带宽达到了448GB/s,光栅单元和纹理单元分别为96和184。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在针对显卡DX11性能的3DMARK FS套装测试中,映众RTX 3070冰龙超级版相较RTX 2080Ti互有胜负,赢面更大一些;但是相比RTX 2070的提升非常大,在FS中分数高48%,在FSE中分数高55%,在FSU中分数高62%。
而映众RTX3070冰龙超级版与公版RTX 3070的差值比较稳定,均在3%左右。
在针对DX12环境下的Time Spy和Time Spy Extreme测试中,映众RTX3070冰龙超级版成绩全部领先RTX 2080Ti,如果说在DX11环境下领先不多,在DX12环境下新架构的优势就凸显出来了。
映众RTX3070冰龙超级版相比RTX 2070的TS分数高58%,TSE中分数高66%。而相比公版RTX 3070的领先幅度为4%左右。
PortRoyal是3DMARK中专门针对光追性能的测试项,映众RTX3070冰龙超级版的测试结果仍然要优于RTX 2080 Ti 6%左右;相比RTX 2070提升58%;而对比公版的提升为3%。
在理论测试中,映众RTX3070冰龙超级版的大部分成绩均优于RTX 2080 Ti,仅在DX11环境下的FireStrike的成绩中被RTX 2080 Ti领先。
下面进行游戏测试环节。不过遗憾的是我们手头没有公版RTX 2080 Ti,无法进行对比测试。上面理论测试的环节成绩也是使用之前的测试成绩进行对比。
游戏性能测试
在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部新血脉》《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件进行测试。
在《古墓丽影:暗影》中,由于加入了光追和DLSS效果,所以我们分为2组6测,为了照顾以前没有DLSS时的测试分数,第一组为预设最高画质下,RTX OFF/DLSS OFF;第二组为预设最高画质下,RTX 超高/DLSS ON。
其中映众RTX3070冰龙超级版对比RTX 2070在1080P分辨率下,提升41%和44%;2K分辨率下提升48%和46%;4K分辨率下提升57%和57%,整体提升幅度在40-50%之间,而且在4K分辨率下的提升尤为明显;而相比公版RTX 3070的提升幅度在5-10%左右。
在《德军总部新血脉》中,由于自带两个benchmark,所以我们的数据取跑分均值,另外游戏跑分中默认不开启DLSS,我们手动将DLSS选项调整为平衡。其中映众RTX3070冰龙超级版对比RTX 2070在1080P分辨率下的分数高28%,2K分辨率下高52%;4K分辨率下高67%。
接下来是《刺客信条:奥德赛》,这款游戏因吃配置而闻名,被玩家戏称为众生平等,在测试中映众RTX3070冰龙超级版频率的提高影响并不是很大,相比RTX 2070在1080P分辨率下分数提升28%;2K分辨率下提升35%;4K分辨率下提升43%。
《孤岛惊魂5》同样算是优化比较到位的3A大作,映众RTX3070冰龙超级版比RTX 2070在1080P分辨率下分数提升24%;2K分辨率下提升41%;4K分辨率下提升53%。
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载,看看自己的显卡处在什么水平线上。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。
在1080P分辨率下,映众RTX3070冰龙超级版比RTX 2070分数高78%,2K分辨率下高79%,4K分辨率下高92%。
《边境》同样是一款来自柳叶刀工作室的国产3A大作,具体发售日期不明,目前仅提供了benchmark跑分软件。
在1080P分辨率下,映众RTX3070冰龙超级版比RTX 2070分数高61%,2K分辨率下高64%,4K分辨率下高69%。
通过游戏的帧数对比不难发现越新发布的采用DX12环境的游戏帧数提升越大,其中以《光明记忆:无限》和《边境》为最,这两款跑分软件的场景演示新增了很多新的光追效果。
如焦散、折射、反射、阴影和环境光遮蔽等更复杂的光线追踪,这对于Turing架构下的第一代RT Core负担非常大,而全新的NVIDIA Ampere下的第二代RT Core可以达到39.7 RT TFLOPS,相比Turing的23.8 RT TFLOPS,运算能力提升了66%,最终的测试结果成绩显著。
温度与功耗测试
在温度功耗测试方面,室温24℃,功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。
相比旗舰级的RTX 3080,映众RTX3070冰龙超级版的功耗要小得多,在峰值情况下整体平均238W左右。
温度方面,映众RTX3070冰龙超级版经过10分钟的拷机,控制在68℃左右,散热效果非常出色,另外这款的Boost频率为1785MHz,热量将会比公版更大一些,但是散热效率要比公版显卡好上不少。
软件与硬件辅助发力
在很多玩家的印象中,显卡是否强大完全取决于硬件配置,但如果没有软件的辅助和加持,性能会大打折扣,甚至发挥不出应有的水平。此次此次随着发布会共同推出的还有以下几项技术非常值得大家关注。
NVIDIA Reflex
系统延迟这个词在以往会被很多人忽略,以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从点击鼠标到实际看到的画面有多大延迟?
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标以及驱动程序中的软件支持。
NVIDIA Broadcast
这次新显卡的NVIDIA Broadcast就是专为主播而来的,不得不说,利用ai技术就能无需后期和摄影环境进行背景直播,这种新功能也会让直播的门槛变低,从而有越来越多优秀主播得意展示自己。它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
和小动物们一起决斗吧!
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来,所以如果你想体验上面的欢乐直播,一张GeForce RTX显卡是必须的。
同时在直播中用户还会面临另一项问题,大部分玩家直播往往只有一台电脑,采集卡根本无用武之地,但在直播过程中会极大占用CPU,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而RTX 30系显卡拥有目前最好的硬件解码器,基于GPU的NVENC解码可以极大地减轻CPU负担。
在相同场景下使用x264编码,CPU的占用率为13.7%,使用硬解NVENC编码,CPU的占用率为1.6%,两种解码方式对CPU的占用率相差12%所有,不过我们的测试平台所使用的CPU为i9-10900k,目前的桌面旗舰级CPU,性能也是顶尖的,仅具有部分参考价值。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键,使用GPU渲染能够使效率快上几倍甚至几十倍。
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现,例如在Keyshot专业渲染软件中,不管是RTX 30系哪一个型号的显卡,都要比CPU渲染快数十倍的速度。NVIDIA Studio不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
如果用户购买映众RTX 3070冰龙超级版显卡,还可以从官网下载INNO3D TUNELT软件这款软件,全新的INNO3D TUNELT软件设计了更直观且人性化的界面,可以在一个界面上实现超频、调灯、监控等多功能,操作上更快捷简便。
INNO3D TUNELT软件首页会显示显卡的基本信息,我们使用的是映众RTX 3070冰龙超级版显卡,可以看到型号、显卡驱动版本、频率、温度、风扇转速、显存等信息一应俱全。还可以手动增加电压、频率等参数。不过新手不建议手动超频,容易导致显卡故障,而且对于此类人为故障是无法保修的。
流光溢彩 畅享性能
得益于全新的NVIDIA Ampere架构,映众RTX 3070冰龙超级版显卡在性能上堪比上代旗舰RTX 2080ti。但是价格上却实打实的是一款定位中端的显卡,从性价比来说非常值得购买。当然映众RTX3070冰龙超级版的频率为1785MHz,相比公版的1725MHz要高上一些,而散热性能会比公版更好,能保证电脑的长时间稳定运行。
同时这次的映众RTX 3070冰龙超级版采用四风扇的设计风格,并且拥有非常出彩的灯光效果,经过实际体验无论你是采用传统的安装方法还是竖装的方法都能提高你机箱的颜值。
总的来说这是一款外观出彩,性能更出彩的显卡,如果你现在想要体验4K游戏,或者是升级配置畅玩2K游戏的话。搭载HDMI 2.1接口的映众RTX 3070冰龙超级版是一个非常不错的选择。