01微星魔龙RTX 3060 Ti评测
产品:GeForce RTX 3060 Ti GAMING X TRIO 微星 显卡随着此次RTX 30系显卡60型号的发布,从入门到旗舰级产品已经补全,整体来看30系显卡有着非常恐怖的性能飞跃,即使是RTX 3060 Ti这种甜品级显卡的性能都在RTX 2080 SUPER,也就是上一代的准旗舰之上。今天为大家带来的是微星GeForce RTX 3060 Ti GAMING X TRIO的评测。
微星GeForce RTX 3060 Ti GAMING X TRIO采用了NVIDIA Ampere架构,相较于上一代的NVIDIA Turing架构有什么不同呢?
第一代RTX架构 Turing下的RTX 2060 SUPER
相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3060 Ti中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060 Ti的着色器性能达到16.2 TFLOPS单精度性能,而Turing为7.2 TFLOPS。
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到31.6 RT TFLOPS,而Turing为21.7 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
例如最新发布的《赛博朋克2077》中,当玩家在游戏中遭遇赛车,追逐,打斗等激烈运动场景,第二代光追在架构上可以确保显卡渲染帧率相对更平稳,游戏体验上不会有频繁掉帧带来的顿挫感。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达129.6 Tensor TFLOPS,而Turing为57.4 Tensor TFLOPS。
芯片虽然决定了显卡的性能和规格,但是显卡工作的整体稳定性,温度表现,噪音等级却更依赖显卡制造商在PCB布线,电子元器件的适配,散热系统调校等综合能力。
GAMING X TRIO是微星的魔龙系列,定位旗舰,所以当入门级的甜品卡遇到旗舰系列,将产生如何的火花,也是我们比较好奇和期待的。此次的魔龙系列与RTX 20系最大的区别我想是引入了石墨烯背板的散热设计,我们在后面的文章中也会详细说明。在评测开始前,笔者为大家总结一些该显卡的特点,也方便大家有针对性的阅读:
石墨烯背板散热设计
旗舰高规,Boost频率达到1830MHz
扎实用料,出色散热
相较公版更高的分数
再度进化的刀锋6代风扇设计
总的来说,微星GeForce RTX 3060 Ti GAMING X TRIO有着超高规格的设计,也拥有更大的频率提升空间。而再度进化的第6代刀锋风扇,给显卡提供了更出色的散热性能和更安静的使用体验。魔龙还是那个魔龙,但性能早已不可同日而语,另外显卡导流罩部分的爪痕背光设计,更给魔龙增加了几分魔幻的感觉。
微星GeForce RTX 3060 Ti GAMING X TRIO
在性能表现上,微星GeForce RTX 3060 Ti GAMING X TRIO超高的频率以及出色的供电散热设计,让分数高于公版的同时温度更低。RTX 3060 Ti这张甜品卡在2K分辨率下可以做到更高帧率的运行,甚至在4K分辨率下的部分游戏也有不错的表现,打破了人们对甜品卡性能不足的印象,加之超高的性价比,微星这款微星GeForce RTX 3060 Ti GAMING X TRIO完全可以满足绝大部分游戏玩家的需求。
01 微星GeForce RTX 3060 Ti GAMING X TRIO外观
首先还是先来看外观,我们本次评测的微星GeForce RTX 3060 Ti GAMING X TRIO保持了魔龙系列一贯的风格,简单硬朗的几何线条贯穿卡身。
微星GeForce RTX 3060 Ti GAMING X TRIO
微星GeForce RTX 3060 Ti GAMING X TRIO显卡的整体尺寸为323×140×56mm,相对其他30系显卡来说卡身略宽,但是厚度适中。显卡正面采用三个10叶刀锋6代风扇主动散热,扇叶采用独特的环形设计,作为第2代TRI FROZR 散热系统的一个重要组成部分,能够进一步降低噪音,提高风压。
微星GeForce RTX 3060 Ti GAMING X TRIO背板展示
微星GeForce RTX 3060 Ti GAMING X TRIO的背板尾部采用镂空设计,可以让热风迅速穿透散热鳍片以及背板,令显卡温度进一步下降,另外在背板靠近芯片部位也有镂空设计,以便发热严重的元件能快速散热。
微星GeForce RTX 3060 Ti GAMING X TRIO背板展示
另外在RTX 30系显卡中,微星的魔龙系列采用了石墨烯背板设计,石墨烯具有非常好的热传导性能。纯的无缺陷的单层石墨烯的导热系数高达5300 W/mK,是为止导热系数最高的碳材料。不过在显卡背板上肯定不会使用单层石墨烯,作为载体的石墨烯复合材料导热系数也是很不错的。
微星GeForce RTX 3060 Ti GAMING X TRIO显卡支架
由于RTX 30系显卡本身的尺寸及重量较大,单纯靠机箱挡板和PCIE插槽已经不足以支撑其重量了,所以在微星GeForce RTX 3060 Ti GAMING X TRIO的包装内部还附赠了显卡支架提供额外的加固效果。
微星GeForce RTX 3060 Ti GAMING X TRIO视频接口
视频输出接口上,微星GeForce RTX 3060 Ti GAMING X TRIO采用DP 1.4a*3+HDMI 2.1的4接口设计,另外新的HDMI 2.1接口可支持单线8K的视频输出。另外从图中我们也能看到由于显卡宽度较大,金属挡板与显卡边缘相差大约2cm,在上机后挡板的螺丝不太好拧。
微星GeForce RTX 3060 Ti GAMING X TRIO侧面
在供电接口上,微星GeForce RTX 3060 Ti GAMING X TRIO采用了8+8pin供电,而且由于RTX 3060 Ti的自身功耗较小,实测满载功耗为220W左右,建议电源为650W及以上,大部分用户都可以直接升级。
02 NVIDIA Ampere架构下的RTX 3060 Ti
微星GeForce RTX 3060 Ti GAMING X TRIO采用了NVIDIA Ampere架构,我们首先来看一下RTX 3060 Ti的提升。
RTX 3060 Ti采用GA104核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3060 Ti中我们都知道仍然采用了GDDR6显存,不过不同于RTX 3080的Micron,RTX 3060 Ti采用了三星的GDDR6显存。
我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
RTX 3060 Ti共有4864个CUDA,其实它有2432个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了4864这个惊人的数字。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
在此次的NVIDIA Ampere架构中,NVIDIA官方宣布为第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,着色器发出光线追踪的请求,交给RT Core来处理,它将进行两种测试,分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing)。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。
而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。
在Turing的RT Core中,可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。
第二代RT Core可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快,它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照NVIDIA自己的实测,比Turing快8倍。
Tensor Core可以看作是GeForce RTX GPU上的AI大脑。可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。例如用于AI超分辨率的NVIDIA DLSS和用于AI增强的声画处理技术NVIDIA Broadcast应用。
在本次的NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。
首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。
与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03 3DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥微星GeForce RTX 3060 Ti GAMING X TRIO显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,RTX 3060 Ti采用GA104核心,三星8nm工艺,芯片面积392平方毫米,拥有4864个CUDA,微星GeForce RTX 3060 Ti GAMING X TRIO的Boost频率达到了1830MHz,而公版为1665MHz。采用8GB GDDR6显存,位宽为256bit,显存带宽达到了448GB/s,光栅单元和纹理单元为80和152。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在针对显卡DX11性能的3DMARK FS套装测试中,得益于超高的频率,微星GeForce RTX 3060 Ti GAMING X TRIO较公版RTX 3060 Ti的成绩均有小幅领先,而相比RTX 2080 SUPER,综合领先在3-6%之间。
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,微星GeForce RTX 3060 Ti GAMING X TRIO领先RTX 2080 SUPER更多,在TS成绩中领先5%,在TSE成绩中领先12%。
PortRoyal是3DMARK中专门针对光追性能的测试项,微星GeForce RTX 3060 Ti GAMING X TRIO的成绩相较公版提升2%,相较RTX 2080 SUPER提升5%。
在理论测试中,公版RTX 3060 Ti可以说是RTX 2080 SUPER的OC版,而微星GeForce RTX 3060 Ti GAMING X TRIO在公版成绩的基础上又有一定提升,所以对比RTX 2080 SUPER还是有着相当大的提升。
04 游戏性能测试
在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
由于本次的参测显卡比较多,而古墓丽影分为标准测试和光追DLSS效果的测试,故分为两张表格进行对比,共2组6测。第一组为预设最高画质下,RTX OFF/DLSS OFF;第二组为预设最高画质下,RTX 超高/DLSS ON。
微星GeForce RTX 3060 Ti GAMING X TRIO相较于公版的帧数有着小幅提升,但与RTX 2080 SUPER的分数,仍然差距不大。
《德军总部新血脉》由于自带两个benchmark,所以我们的数据取跑分均值。微星GeForce RTX 3060 Ti GAMING X TRIO相较RTX 2080 SUPER在1080P分辨率下提升8%,2K分辨率下提升17%,4K分辨率下提升4%。
接下来是《刺客信条:奥德赛》,其中微星GeForce RTX 3060 Ti GAMING X TRIO比RTX 2080 SUPER在1080P分辨率下分数高7%;2K分辨率下高12%;4K分辨率下高9%。虽然在1080P及2K分辨率下的帧数提升明显,但4K分辨率下与公版相同。
《孤岛惊魂5》同样算是优化比较到位的3A大作,微星GeForce RTX 3060 Ti GAMING X TRIO比RTX 2080在1080P分辨率下分数高6%;2K分辨率下高20%;4K分辨率下高24%。
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。
在这项游戏测试中,由于减少了显卡数量,所以微星GeForce RTX 3060 Ti GAMING X TRIO在图中的颜色产生了变化,还请大家注意。这款benchmark跑分软件在光追效果最高的情况下,运用了多种光线追踪技术,所以即使强如RTX 3080在4K分辨率下也只能跑到35帧。
《边境》同样是一款来自柳叶刀工作室的国产3A大作,具体发售日期不明,目前仅提供了benchmark跑分软件。同样的目前跑分软件不支持关闭光追选项,所以在测试时我们选择“RTX 最高/DLSS 性能”下进行。
05 温度与功耗测试
在温度功耗测试方面,室温24℃,我们并没有采用全封闭式的机箱,而是采用测试平台的方法,这样做可以最大限度的保证显卡除了自身散热外将风道等外因减小到最低。
功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。作为一款甜品级显卡微星GeForce RTX 3060 Ti GAMING X TRIO的功耗要小得多,在峰值情况下整体平均在220W左右。
温度方面,本次的微星GeForce RTX 3060 Ti GAMING X TRIO经过10分钟左右的拷机,温度稳定为66-67℃,相对公版低了7℃左右,除了优良的散热设计,新采用的石墨烯散热背板看来也起到了关键作用。
06 部分游戏光追效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《堡垒之夜》RTX ON(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
第二组对比来自最新的《魔兽世界9.0》,同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
第三组对比为《控制》游戏,这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
07 软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
08 甜品与旗舰的融合
RTX 3060 Ti从显卡型号上来讲属于甜品卡,但魔龙系列本身又是微星的旗舰系列,当甜品与旗舰融合后,造就了微星GeForce RTX 3060 Ti GAMING X TRIO这款拥有超高性能与高性价比的显卡。
从外观上来说,魔龙还是那个魔龙,玩家一眼便能认出,但在一些细节之处也有很大改变,如显卡正面导流罩部分的爪痕背光设计,更给魔龙增加了几分魔幻的感觉;还有背板的材质改变,微星的魔龙系列采用了石墨烯背板设计,石墨烯具有非常好的热传导性能,这使得显卡能进一步提高散热性能。
微星GeForce RTX 3060 Ti GAMING X TRIO
不过无论外观和散热怎么创新,用户最关心的还是显卡本身的性能,RTX 3060 Ti给了我们足够的惊喜,作为一款甜品卡,原本以为只是能超过RTX 2070 SUPER的性能,没想到一举超过了RTX 2080 SUPER,并且在售价上保持了与RTX 2060相同。而微星GeForce RTX 3060 Ti GAMING X TRIO在公版的基础上性能更进一步,Boost频率达到了1830MHz,游戏帧数上也有一定程度提升。
微星GeForce RTX 3060 Ti GAMING X TRIO
虽然价格与20系相同,但全新的NVIDIA Ampere架构采用了第二代RT Core和第三代Tensor Core,在光线追踪和AI学习方面都有不同程度加强,还拥有更高的能耗比。
另外从游戏方面来说,这款甜品卡同样有着非常恐怖的性能,完全可以满足在2K分辨率下的高帧率游戏体验,甚至部分游戏在4K分辨率下也可以保障60帧的流畅运行。
微星GeForce RTX 3060 Ti GAMING X TRIO
微星GeForce RTX 3060 Ti GAMING X TRIO的售价为3999元,相较公版提高不少,但高规旗舰的做工加上扎实的用料,确实配得上这份价格。而且这款甜品卡不管是深度办公、后期剪辑还是3A游戏,都能有出色的表现。尤其对于游戏玩家来说,这款甜品的确有点出乎意料。