热点:

    iGame GeForce RTX 4090 Vulcan首测 赛博堡垒利刃升级

      [  中关村在线 原创  ]   作者:曲楠
    返回分页阅读本文导航

    01iGame RTX4090 Vulcan首测

    产品:iGame GeForce RTX 4090 Vulcan OC 七彩虹 显卡

    RTX 40系显卡第一款解禁的显卡已经与我们见面,超旗舰的“90”级别产品性能也让大家过足了瘾。今天则为大家带来了七彩虹iGame GeForce RTX 4090 Vulcan OC的非公版显卡首测。


    此次RTX 40系列解禁的顺序有些耐人寻味,“90”级别的产品虽然会在第一批公布,但通常代表着游戏旗舰的“80”显卡会打头阵。

    其实根据目前的情况来看,RTX 4090的率先推出,RTX 3090及“Ti”的停产,都是为了照顾仍在市售的RTX 30系产品。

    当然,这次NVIDIA对于RTX 4090的性能表现同样非常期待,并且提供了大量用于DLSS 3测试的游戏。

    iGame GeForce RTX 4090 Vulcan首测
    iGame GeForce RTX 4090 Vulcan OC

    本次RTX 4090的市售时间与性能解禁时间相同,也就是说大家看到首测的时候已经可以开始抢卡了。七彩虹共发布了RTX 4090三个型号,分别为七彩虹iGame火神超频版、iGame水神超频版以及原价的七彩虹战斧豪华版,有兴趣的玩家可以关注一下。

    01 iGame GeForce RTX 4090 Vulcan OC概览

    近几代显卡,其实每一次iGame的设计理念都比较有意思,以我们这次测试的Vulcan系列来说。在RTX 30系中,它一改以往甲胄式设计,将赛博朋克元素,这种极具未来科技感的风格融入到了显卡中,外甲线条张力十足,棱角分明。


    赛博朋克时代

    而在此次RTX 40系显卡中,Vulcan系列虽然延续了赛博朋克风格,但整体设计却给人一种现实与幻想碰撞的感觉——这就是后赛博时代。

    关于赛博朋克的概念,想必大家都已熟知。“高科技、低生活”可以很好地概括赛博朋克世界中的人们。霓虹闪烁的夜空下,潮湿的路面变成了反光源,衬托出都市畸形的繁华,整个城市充满故障和错位感。


    后赛博时代

    而后赛博时代虽然依然继承了“高科技、低生活”的基本格局,但对“高科技”的看法更为现实,对“低生活”的态度更为乐观。比起愤怒,更多是苦中作乐。

    后赛博时代最明显的特征便是少了许多强烈碰撞的色彩,取而代之的是以黑白灰为主,少量彩色光源点缀的躺平生活。

    有意思的是,赛博时代更多的是对赛博朋克的戏仿和自嘲。

    日前比较火的游戏《Stray》,其实就是对后赛博时代最好的诠释。生活的居民从没有见过真正的蓝天,对自然的向往只停留在百年前残存的画片中。


    《Stray》

    当人类正在享受科技带来的巨大便利时,地球的气候环境早已不再适合人类居住。人类为了躲避瘟疫建立了一个地下堡垒,堡垒中由上到下分别为顶层,中城区,蚁村,死城。

    同时因为地下堡垒的封闭性,无法照射到太阳,人们只能依靠虚拟现实世界来躲避现实。

    iGame GeForce RTX 4090 Vulcan首测

    本次iGame火神系列在外观上最大升级其实有两点,外甲和屏幕。

    正如之前所说,本代火神显卡显得更为现实,是那种钢筋混凝土构筑起堡垒的“现实”,整体色调采用黑白灰,恰如人们最坚实的依赖。


    而幻想,则是本次火神升级的“智屏”,不再局限于翻折,而使用USB线连接至电脑,可摆放在任意位置。这极其类似赛博朋克时代随处可见的屏幕。

    iGame GeForce RTX 4090 Vulcan首测

    首先来看一下本次iGame GeForce RTX 4090 Vulcan OC的配件,两块屏幕位于最左侧,而智屏更是贴心的保护起来,避免表面划伤影响观赏效果。除此之外还有金属显卡支架以及螺丝刀。

    iGame GeForce RTX 4090 Vulcan首测

    另外则是必不可少16pin转8pin*4的电源转接线、灯光同步线&素材上传线以及智屏的可磁吸底座。

    本次虽然公版RTX 4090的建议电源与RTX 3090 Ti相同,都是850W。但超频版的显卡加上CPU等对电源有要求的设备。官方建议的1000W电源更加稳妥,所以大家还是看看能否兼容。


    另外本次iGame还推出了有意思的周边,iGame奇趣主机拼奇积木。别看只是一款主机造型的小摆件,但其难度不亚于小街景的制作,对于动手感兴趣的玩家不妨了解一下。

    iGame GeForce RTX 4090 Vulcan首测

    iGame GeForce RTX 4090 Vulcan OC整卡的尺寸为348.5×159.5×70.4mm,这张卡的尺寸相较我们评测过的其他AIC RTX 4090来说,还算是比较小的,尤其是长度方面。但即便这样,这张RTX 4090也依然是巨无霸一般的存在,相较于以前的iGame家的显卡来说还从未有过的尺寸。

    iGame GeForce RTX 4090 Vulcan首测

    iGame GeForce RTX 4090 Vulcan OC外甲的设计虽然整体以深灰色“混凝土”风格为主,但依然能看出其中的金属元素,仿佛是坚固堡垒中,保护人类的最后防线。

    iGame GeForce RTX 4090 Vulcan首测

    散热方面,本次iGame GeForce RTX 4090 Vulcan OC整体采用了旋涡(Vortex)散热器,三个104mm的大直径风扇作为主动散热,创新的“聚风镰环”扇叶是本次改进的关键,升级加固的叶片环环相连,能提供最大程度的散热效果。


    在内部散热模组上,iGame GeForce RTX 4090 Vulcan OC采用导流型鳍片,9根8mm的热管配置堪称豪华,“回流焊”工艺使热管与鳍片贴合更紧密,优化散热效能。


    真空冰片技术

    而内部采用了真空冰片技术,超扁平的密闭腔体内充冷凝液,吸收热量后通过相变原理散发热量,真空密闭腔体与热管及鳍片合为整体,散热效能更好。

    iGame GeForce RTX 4090 Vulcan首测

    视频输出接口上,iGame GeForce RTX 4090 Vulcan OC采用了与公版相同的HDMI 2.1 + DP 1.4a*3的四接口设计。

    至于呼声较高的DP 2.0,其实目前绝大部分消费级游戏显示器都没有实装,且DP 1.4a标准也能够支持8K 60Hz刷新率的显示器。所以,综合来看,绝对够用。

    作为七彩虹标志性的一键超频按钮,在RTX 40系中自然也得到了传承,良好的机械反馈手感加上点亮后的冰蓝色灯光,仪式感十足。

    iGame GeForce RTX 4090 Vulcan首测
    16pin辅助供电左侧为素材上传&灯光同步接口

    本次iGame GeForce RTX 4090 Vulcan OC的TDP官方给出的为550W/515W,搭载单16pin辅助供电。公版显卡的内部供电为20+3相;而iGame这张显卡为24+4相,并且频率也要更高,所以建议的1000W电源,确实并不过分。

    目前已有部分电源厂商发布了最新的ATX 3.0标准高端电源,自带12VHPWR的16pin供电接口,单口最高可支持600W供电。所以不出意外的话,或许下一代显卡也将采用这样的单16pin来供电。

    虽然目前所有显卡厂商基本都会附赠一根转接线,不过8pin*4的杂乱程度可想而知,有条件的话,一个ATX 3.0标准的电源简直不要太整洁。

    需要注意的是,目前适用于RTX 30系列的12pin接口和电源转接器与RTX 40系列显卡不兼容。

    另外在RTX 40系显卡中,将不再支持NVLink,所以想要重现往日的四路泰坦是不可能了。

    iGame GeForce RTX 4090 Vulcan首测

    再来看一下背板,从右侧镂空的背板能看到大量散热鳍片以及热管,这款iGame GeForce RTX 4090 Vulcan OC同样采用了较短的PCB板,以满足散热鳍片的整体散热效果。

    02 智屏及iGame Center软件

    本次随着RTX 40系显卡的发布,iGame Center软件也迎来了升级,全新的2022版界面排布更整洁。

    iGame GeForce RTX 4090 Vulcan首测

    在软件首页会显示所有的硬件信息,并且非常详尽,比如显卡的CUDA数量以及显存,都能够清晰看到。

    iGame GeForce RTX 4090 Vulcan首测

    在硬件控制中,主要可以调节灯光系统,可全局调控也可单独调控。选择上边的单独调控是我们本次设置智屏的重点。

    iGame GeForce RTX 4090 Vulcan首测

    本次中默认的灯光效果其实都非常好看,尤其是GPU和CPU专注的参数显示,非常具有赛博朋克的感觉。

    在自定义图片中,玩家可以手动上传自制图片。同时由于屏幕的升级,分辨率由上代的480×128px 提升为 800×216px,更具视觉冲击力。

    iGame GeForce RTX 4090 Vulcan首测

    在显卡侧面,可以看到原本RTX 30系翻转屏的位置,改为了触点式磁吸的设计,可吸附iGame Vulcan灯控组件或者横置、竖置的智屏。


    由于智屏的升级,可搭载底座放置于机箱外部,这个位置空着当然不行,所以当智屏不在显卡上时,这个iGame Vulcan的灯控组件可以直接吸附在上面。不过有一点,这个灯控组件不兼容底座。


    iGame Vulcan智屏的底部及背部都拥有磁吸触点,并且“即吸即用”非常方便。


    外接底座的好处就是可以放在任何桌面摆件上,并且升级后高清的分辨率显示效果也更好。常规的图片上传没什么冲击力,下面笔者上传了一段NVIDIA Racer RTX的视频。

    iGame GeForce RTX 4090 Vulcan首测

    不过需要注意的是,上传素材过大最好使用显卡内附带的素材上传线,否则等待时间会比较长。

    03 Ada Lovelace 是谁?

    下面我们来看一下此次推出NVIDIA Ada Lovelace架构,我们先从Ada Lovelace这个人讲起,相较于Ampere,这位似乎大家更陌生一些。

    Ada Lovelace(1815-1852)是英国数学家、计算机程序创始人,建立了循环和子程序概念,被称为世界上第一位程序员

    Ada从小对数学有极高天赋,其父称她为“平行四边形公主”,后来的合作伙伴Charles Babbage称她为“数字女巫”。在19岁时Ada嫁给了自己曾经的科学家庭教师,婚后的她对数学热情不减。

    1842年到1843年花了9个月时间翻译了Babbage的《分析机概论》的备忘录,写了很多注记,其中给出了用计算机进行Bernoulli数求解的详细说明。由此,Ada被广泛认为是世界上第一位程序员。

    而以她名字命名的语言——ada语言,已经成为了美国军方开发战斗机等尖端武器的语言。

    从几行简短的生平简介中,不难看出Ada的生命虽然只经历了短暂的37个春秋,但却足以被后人铭记。

    这也是为什么此次NVIDIA RTX 40的先行宣传中,用到了“以未来敬传奇”的slogan,下面我们详细剖析一下,这次的Ada Lovelace还有哪些创新和超越。

    04 NVIDIA Ada Lovelace架构

    本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4nm定制工艺(TSMC 4 nm NVIDIA Custom Process),旗舰核心AD102达到了恐怖的760亿个晶体管,而在RTX 30系显卡中为280亿个。

    与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可达到90-TFLOPS的着色器数据吞吐量,而本次发布的GeForce RTX 4090则达到83-TFLOPs,相比上一代NVIDIA Ampere则只有40-TFOPs。

    完整的AD102核心共有18432个CUDA,其中包含12个图形处理集群(GPCs), 72个纹理处理集群(TPCs), 144个流式多处理器(SMs)。144个第三代光追核心(RT Cores)、576个第四代张量核心(Tensor Cores)。另外可以看到Boost频率也从1.9GHz猛增到了2.5GHz。

    另外一点在架构图上没有体现的是,AD102核心还包含288个FP64双精度浮点核心(每SM 2个),用来确保FP64代码正确处理,包括FP64张量核心代码。

    通常来讲,单精度浮点运算会用于深度学习模型训练,而双精度浮点运算则用于数值模拟工作。通常游戏卡都会砍掉FP64,这既节省了成本,又对游戏本身没有影响。而专业卡都保留有FP64,目的就是为了精度更高训练与计算。

    此次资料中只提到了AD102核心搭载了288个FP64,尚不知道后续的推出的产品有无变更。

    了解了完整的GA102核心,我们再来看一下RTX 4090的核心,其实知道了RTX 4090的参数,我们大概也能了解到后续可能推出的“Ti”系列究竟相差在哪。

    相比完整的GA102来说,RTX 4090共有16384个CUDA,其中包含11个GPC、64个TPC以及128个SM单元,第三代RT Cores为128个,第四代Tensor Cores为512个。

    其实根据完整的架构图就能看出,此次Ada架构整体结构性的改动并不大,这一点从SM单元便能清晰印证,同样的FP32 CUDA核心,同样的FP32/INT32混合CUDA核心,同样的L1级缓存等等。当然,每个SM单元内部的Tensor Core升级为第四代。

    不过变化最为显著的,则是第三代光追核心,我们结合两代架构来看。在第二代光追核心中,包含负责边界交叉测试的Box Intersection Engine引擎,和负责三角形交叉测试的Triangle Intersection Engine引擎。

    而在第三代光追核心中,还增加了两个新的引擎:Opacity Micro-Map Engines(OMM)和Displaced Micro-Mesh Engines(DMM),这两个新的硬件单元可以极大地提升光追性能(具体原理后文详细介绍)。

    至此,每2个SM单元组成一个TPC单元,每6组TPC单元组成一个完整的GPC顶层单元(在部分核心中,会出现5组TPC组成一个GPC单元的情况)。

    而每个GPC单元又搭载一个独立的光栅引擎、两组ROP分区(每组包含8个ROP单元)。

    过多关于数数的部分就不再介绍了,毕竟此次架构图的大面上与NVIDIA Ampere架构基本相同,下面我们分别来看看,除了性能Ada架构还有哪些升级。

    Shader Execution Reordering (SER)着色器执行重排序

    SER主要的作用是提升着色器性能,它可以将效率低下的工作负载,动态重组为更高效的工作负载。主要针对光线追踪的性能提升非常大。

    简单地说,GPU在执行类似工作的时候效率最高。但随着光追效果越来越强大,每个场景可能有数百万条光线照射在不同材质上,而我们知道不同材质的反射率,以及反射效果也是不同的。所以这样就为着色器创建了大量的、发散的,效率低下的工作负载。

    SER则可以将这些杂乱的指令重新分门别类,动态重组为更高效的工作负载。根据NVIDIA的说法,SER可将着色器性能最多提升2倍,并将游戏帧率最高提升25%。

    举个简单的例子,当光线第一次从发射端到碰撞端是非常有规律的射线,而碰撞到物体后的二次光追,则会出现大量发散的、无规律的反射,这对于光追负载是非常高的。而从图中便能看到,SER可以将这些指令进行二次排序,以发挥出着色器的最大性能。

    不过好在这么实用的功能并不是RTX 40系的专利,它是一个易于集成的SDK,目前需要游戏开发商集成在游戏中。另外由于它是一个通用的逻辑,后续也有可能直接集成在Windows的API中,这样游戏开发者就无需特意引用,直接调用系统API即可。

    可以说SER对于手持RTX 20系及以上(能够开启光线追踪)的N卡用户来说,是极大地福音。毕竟免费提升的光追性能,谁不喜欢呢。

    第三代 RT Cores

    RT Core的作用在于更快的光线追踪计算能力,如果说在RTX 30系显卡中,想要畅享4K高帧率游戏有点吃力,那么RTX 40系显卡中,将显得轻而易举。

    在GeForce RTX 4090这张显卡上,达到了191 RT-TFLOPs的处理能力,而RTX 30系显卡最快处理能力为78 RT-TFLOPs,足足为2.4倍。并且根据NVIDIA的官方说法,第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍。而这只能说明,这张4090并非Ada Lovelace架构的最终形态。

    Opacity Micro-Map Engines(OMM)

    在第三代RT Cores中引入了两个重要的硬件单元,首先是Opacity Micro-Map Engines,可以理解为微映射透明度引擎,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。

    比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的。

    不过Opacity Micro-Map Engines可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担。

    Displaced Micro-Mesh Engines(DMM)

    Displaced Micro-Mesh Engines可理解为微网格置换引擎,它构建光线追踪的BVH(Bounding volume hierarchy)的速度提高了10倍!所使用的的显存减少了20倍!

    DMM由第三代RT core本地处理,与前几代相比,它只使用基本三角形渲染复杂几何图形,极大减少了存储和处理需求。

    具体的工作原理从图中一目了然,新的DMM可以将面数非常多的复杂图形做简化,创造出简单的模型,但整体的光线追踪效果不变。

    通过一些模型数据我们可以具体看到,新的DMM将模型简化了多少。原本1100万三角面的模型,经过简化后,只有15万左右的微网格,BVH的构建速度提升了8.5倍,小了6.5倍。

    而这还不是最夸张的,越复杂的模型往往优化的效果越好,在官方展示的这几组对比示例中,最快可提升大于15倍的速度,容量简化20倍的模型。

    第四代 Tensor Cores

    除了光追单元的升级外,第四代张量核心的升级更加恐怖。它采用了新的FP8张量引擎,在GeForce RTX 4090这张显卡上,吞吐量达到了1.32 Tensor petaFLOPs,提高了5倍。

    注意这里的单位——petaFLOPs。以往的TFLOPs为万亿次浮点运算,而petaFLOPs则为千万亿次浮点运算。

    DLSS 3 神经网络渲染新时代

    本次推出的DLSS 3也是RTX 40系一大卖点,从DLSS 2.3直接迈入了3.0版本,也能看出此次的升级之大。而DLSS 3也被NVIDIA官方称为神经网络渲染新时代。

    全新的DLSS 3在原有的DLSS超分辨率的基础上,添加了光学多帧生成技术,以生成全新的帧,而不像原来只能生成像素。

    DLSS 3结合了DLSS超分辨率、DLSS帧生成和NVIDIA Reflex这三大技术,能够重建八分之七的像素,极大提高性能。

    在GPU受限的游戏中,比如2K分辨率及以上的更高分辨率,DLSS 2能够将帧率提高2倍,DLSS 3则能够提升4倍。

    本次DLSS 3跨越了一个大版本,从想法和原理上也再度升级,完全“猜想”1帧的技术,我们解释起来简单,但实施起来需要大量的推理与演算,以及绝对超前的想法。

    不过“凭空”生成的1帧,在延迟上绝对要比DLSS 2高。所以此次完整的DLSS 3中,捆绑了NVIDIA Reflex,可以有效帮助减小延迟。

    这也不负NVIDIA给它起了个“神经网络渲染新时代”的名号。纵观目前市面上的XeSS、FSR技术,DLSS绝对称得上“巨人的肩膀”。当然,连年的创新,苦的是手持上一代显卡的玩家,想体验DLSS 3的帧生成,目前唯一的办法就是购入一张RTX 40系显卡。

    New Optical Flow Accelerator

    New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的,这也是为何DLSS 3中的帧生成为RTX 40系显卡独享。

    光流加速器在原本DLSS 2的基础上,还可以计算两个连续帧内的光流场,能够捕捉游戏画面从第1帧到第2帧的方向和速度,从中捕捉粒子、反射和光照等像素信息。并分别计算运动矢量和光流来获得精准的阴影重建效果。

    以《赛博朋克2077》为例,在第一帧,光流加速器会捕捉到每一个像素中的粒子、反射和光照等信息。并在第二帧中查找匹配的像素区域,计算帧之间的差值。

    如果说原来DLSS 2能够“猜”出一张图剩下的像素,那么DLSS 3除了这些,还能够“猜”出下一帧的画面。

    另外由于DLSS 3的帧生成是在GPU中处理和运行的,所以即使遇到CPU瓶颈的游戏,AI同样能够提升帧率。这也是为什么在此次发布会中说到,DLSS 3能够突破CPU的限制来提升帧数。

    双AV1编码器

    本次升级的第八代NVENC编码器可以说是直播、视频、后期工作者的极大福音。它首次加入了对AV1编码的支持,最显而易见的效果就是直播。

    相比传统的H.264编码,AV1编码的效率平均提升了40%,在同码率下AV1编码的画质将更好。目前大部分直播的分辨率和清晰度,均受限于平台规定的最大比特率。以Twitch限制的8Mbps为例,可以看到在同等带宽下,同为2K 60帧的画面,采用AV1编码的清晰度明显比H.264更高。

    说起直播,OBS相信大家都不陌生,在10月份即将发布的补丁中,OBS就加入了对NVENC的AV1编码支持

    当然,直播只是我们更容易见到的AV1优势,在视频工作的所有环节,AV1编码都可以带来极大提升。

    所以,如图所见。NVIDIA已经为广大用户铺好了一条完整的生态链,从编码API、软件、平台到播放器,将全面支持AV1编码。

    另外再说一下NVIDIA一直强调的双AV1编码。顾名思义,即部分显卡内搭载了两个编码器,它所带来的效果也是显而易见的。

    首先,根据官方宣传的,在4K H.265的导出速度上,RTX 4090是RTX 3090 Ti的2.2倍;在8K H.265的导出速度上更是达到了2.5倍。这部分的提升,大家常用的剪映同样适用,感兴趣的用户不妨亲自体验一下。

    除了导出速度,8K 60帧的视频录制在以前简直难以想象,而双编码器的好处就是可以将图像一分为二,两个编码器分别处理7680×2160的图像信息,最后拼合完整。

    关于编码部分,可能大部分用户的感受不深,但当有一天,你想录屏的时候,却发现显卡不支持,才会发觉它的重要性……

    随着图像逐渐进入到超清时代,硬件编码和渲染几乎已经成为不可或缺的帮手。虽然论质量,硬件编码仍不及CPU软编,但软编做到了极限画质,也要承受时间的无穷长。

    甚至在一张8K渲染图中,两种编码方式的时间差距就已经达到了几个小时,遑论一段10秒的CG动画。在不断进步的硬件编码中,质量和时间也在不断地被挑战和刷新。

    05 测试平台简介

    首先介绍一下测试平台,为了保障iGame GeForce RTX 4090 Vulcan OC这张怪兽的性能发挥,我们的平台也再次进行了全面更新。


    不过由于手头上没有旗舰处理器,采用了本代中高端产品,并且在电源上进行了着重升级。采用了鑫谷1250W的金牌全模组电源。


    首先看一下GPU-Z的参数,iGame GeForce RTX 4090 Vulcan OC采用AD102核心,采用TSMC 4nm定制工艺(TSMC 4 nm NVIDIA Custom Process),芯片面积608平方毫米,这里相对于RTX 30系的GA102的628平方毫米更小。

    拥有16384个CUDA,相比RTX 3090 Ti的10752多52%,Boost频率达到了2625MHz,相比公版的2520MHz提升非常大。

    采用24GB GDDR6X Micron显存,位宽为384bit,显存带宽达到了1008.4 GB/s,光栅单元和纹理单元为176和512。

    06 理论性能测试

    下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

    iGame GeForce RTX 4090 Vulcan首测

    在针对显卡DX11性能的3DMARK FS套装测试中,iGame GeForce RTX 4090 Vulcan OC的提升非常惊人,可以看到在分辨率越高的情况下这张显卡提升越大,其中FS提升了49%;FSE提升了67%;FSU则暴力提升了78%

    综合来看,在整个FS套装的测试中,iGame GeForce RTX 4090 Vulcan OC相较GeForce RTX 3090 Ti的提升约为65%

    iGame GeForce RTX 4090 Vulcan首测

    而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,iGame GeForce RTX 4090 Vulcan OC相较GeForce RTX 3090 Ti的提升分别为:TS提升57%;TSE提升69%,综合下来约为63%

    iGame GeForce RTX 4090 Vulcan首测

    PortRoyal是3DMARK中专门针对光追性能的测试项,iGame GeForce RTX 4090 Vulcan OC相较GeForce RTX 3090 Ti的提升约为56%

    综合来看,iGame GeForce RTX 4090 Vulcan OC的理论性能相较GeForce RTX 3090 Ti的提升约为61%


    iGame GeForce RTX 4090 Vulcan OC DLSS 3 4K

    在本次测试中,我们使用3DMARK的测试版进行了DLSS 3的相关测试。在4K分辨率下,DLSS关闭为52.34帧,DLSS 3开启后为156.56帧


    RTX 3090 Ti DLSS 2 4K

    另外我们也测试了GeForce RTX 3090 Ti在该程序下成绩,其中DLSS关闭为32.73帧,由于不支持DLSS 3,所以在DLSS 2下的成绩为83.63帧。

    iGame GeForce RTX 4090 Vulcan OC在开启DLSS 3后,相比关闭提升了199%;而GeForce RTX 3090 Ti在开启DLSS 2后,相比关闭提升了155%

    当然DLSS 3最夸张的还不止数字上这么简单,我们再来看看这张图。


    iGame GeForce RTX 4090 Vulcan OC DLSS 3 8K

    在8K(7680×4320)分辨率下的DLSS 3测试中,iGame GeForce RTX 4090 Vulcan OC在DLSS关闭的情况下仅有12.66帧,已经无法正常运行游戏,而在开启DLSS 3后,一跃达到了87.24的流畅水准,提升了582%!

    通过DLSS的测试,其实给我的震惊很大。不难发现在分辨率越高的情况下,帧率提升越大,8K 60帧对于现在的显卡来说早已不是触不可及的目标,而在4K分辨率下,即使是3A游戏也能够达到电竞级的帧率,我们在后面会对游戏进行详细测试。

    07 常规游戏性能测试

    由于本次RTX 40系加入了DLSS 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

    iGame GeForce RTX 4090 Vulcan首测

    首先在《地平线5》中,可以明显看到,不止在1080p分辨率下,即使在2K分辨率中,受限CPU的情况依然明显。作为一款标准的3A游戏,在4K分辨率下依然可以跑到135帧,这在以前绝对是无法想象的。

    性能方面,iGame GeForce RTX 4090 Vulcan OC相比GeForce RTX 3090 Ti的提升分别为:1080p提升35%;2K提升39%;4K提升59%,综合提升44%。

    iGame GeForce RTX 4090 Vulcan首测

    在《刺客信条:英灵殿》中,iGame GeForce RTX 4090 Vulcan OC相比GeForce RTX 3090 Ti的提升分别为:1080p提升49%;2K提升53%;4K提升44%,综合提升49%。

    iGame GeForce RTX 4090 Vulcan首测

    在《无主之地3》中,iGame GeForce RTX 4090 Vulcan OC相比GeForce RTX 3090 Ti的提升分别为:1080p提升51%;2K提升64%;4K提升70%,综合提升62%。

    iGame GeForce RTX 4090 Vulcan首测

    《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。所以测试帧数相对较低,但实际游戏配置相当亲民。

    性能方面,iGame GeForce RTX 4090 Vulcan OC相比GeForce RTX 3090 Ti的提升分别为:1080p提升42%;2K提升58%;4K提升67%,综合提升56%。

    iGame GeForce RTX 4090 Vulcan首测

    在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

    在《边境》中,iGame GeForce RTX 4090 Vulcan OC相比GeForce RTX 3090 Ti的提升分别为:1080p提升49%;2K提升67%;4K提升81%,综合提升66%。

    08 DLSS 3性能测试

    由于本次新技术DLSS 3的推出,将有35款游戏将于近期推出全新的DLSS 3功能,本次我们也拿到了部分游戏的测试版。

    另外《超级人类》、《生死轮回》、《逆水寒》“拂云庭“、《微软模拟飞行》、《瘟疫传说:安魂曲》都将在10月陆续发布支持DLSS 3的版本。


    其中《赛博朋克2077》、《F1 22》、《瘟疫传说:安魂曲》、《微软模拟飞行》、《逆水寒》本次进行了DLSS 3的测试,另外Unity和虚幻引擎也提供了本次的测试程序。

    本次DLSS 3的测试图标比较繁琐,并且增加了1% Low FPS和延迟的测试,普通的FPS好理解,那么这个1% Low FPS是什么意思。

    首先,游戏benchmark通常测试的FPS即为,一段时间内的游戏平均帧。而1% Low FPS则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。

    其实简单来说,这两个数值都不能代表我们在游玩时,具体哪一刻的感受,但FPS更注重整体,而1% Low FPS则是从最差的里面求平均,更谨慎一些。



    看懂了1% Low FPS,我们再来看这张图表,在坐标轴左侧的为延迟(越低越好),坐标轴右侧的均为帧数(越高越好),并且由于牵扯到正负坐标,所以两侧的值有可能会不同。

    Frameview中的测试结果为小数点后三位,为了方便观看,这里在帧数上进行四舍五入,延迟则保留小数点后一位。由于目前测试DLSS 3的游戏均为测试版,所以难免出现BUG。

    在《微软模拟飞行》中,在开启和关闭DLSS 2的时候,分数几乎无变化。这款游戏是极度吃CPU资源的游戏,如果瓶颈卡在处理器上,那么传统的DLSS 2的确无法提供更多的帧数加成。

    而在DLSS 3中,我们能够明显看到帧数的大幅提升,要知道我们所有DLSS 3的测试均在4K分辨率下进行。

    不过帧生成并不是毫无弊端,这也是为什么此次测试加入了延迟。并且在开启DLSS 3后,NVIDIA Reflex是捆绑开启的。但相对于DLSS 2增加的这点延迟,在实际体验中的感受并不强。


    在《赛博朋克2077》中的数据反映比较真实,可以看到在DLSS关的光线追踪最高的情况下,即便iGame GeForce RTX 4090 Vulcan OC显卡也只有43帧,并且延迟达到了85.3毫秒。

    而在开启DLSS 3后,帧数为129,提升了200%。虽然相比DLSS 2的延迟高了6毫秒左右,但相比关闭DLSS来说,依然维持在较低的水平。



    《瘟疫传说:安魂曲》是即将发布的一款游戏,在DLSS 3和DLSS关之间的帧数提升,同样达到了128%。不过在这款游戏中,DLSS 3相比DLSS 2的延迟增加了18.4ms,但依然比关闭DLSS状态下要低得多。



    目前《F1 22》的数据测试同样有问题,在DLSS关和DLSS 2中均没有延迟数据。

    这一组主要看帧数的提升。其中DLSS 3相比DLSS关的帧数提升了121%,相比DLSS 2的提升也达到了57%



    最后则是国产游戏《逆水寒》的光追测试,本次我们选择的测试demo采用了真正的全局光照。

    所以在我尝试关闭DLSS运行后,第一次电脑直接崩溃重启,第二次侥幸能够运行,帧数也仅有个位数,而延迟早已上万。

    还记得在纯光线追踪软件中测试的《光明记忆无限》和《边境》,在本次只有DLSS 2的情况下都能够达到80帧左右。而《逆水寒》这款真正意义上的全局光照,在DLSS 2开启后仅有42帧左右,着实恐怖。

    另外此前DLSS 3的测试,在8K分辨率下也已经达到80帧左右,而《逆水寒》的光追测试中,在开启DLSS 3的情况下,4K分辨率也只有69帧。

    测试到这里,不禁发问。全局光照真的是未来游戏的形态吗?虽然通过NVIDIA官方的宣传片中能够看到极其逼真的游戏画面,但对于硬件的要求却超乎想象。

    个人认为起码短时间内,想要普及全局光照游戏还是有些难度的,除非……下一代的架构会有较大的改动。


    当然针对画质方面,我们也进行了测试,在上图中我们截取《赛博朋克2077》中的一角,可以看到在两种DLSS模式下,相较原画质几乎没有明显变化,只在栅栏处的光影效果有所不同,但对于如此大幅度的帧数提升,这点下次几乎可以忽略不计。


    RTX 3090 Ti即时帧数 39帧


    iGame GeForce RTX 4090 Vulcan OC 即时帧数 77帧

    在Unity的测试程序中,有一组实时演算的光线追踪+DLSS的帧数对比。iGame GeForce RTX 4090 Vulcan OC在开启DLSS 3后,实时帧数为77;而GeForce RTX 3090 Ti在开启DLSS 2后,实时帧数为39帧,提升约为97%。


    DLSS 关 70帧


    DLSS 2 121帧


    DLSS 3 160帧

    在UE5提供的测试游戏中,方便的给出了DLSS的快捷测试,这里分为DLSS关(超分辨率关+帧生成关+Reflex关);DLSS 2(超分辨率性能+帧生成关+Reflex开);DLSS 3(超分辨率性能+帧生成开+Reflex开)三档测试。

    其中,iGame GeForce RTX 4090 Vulcan OC在DLSS关的即时帧数为70帧,DLSS 2为121帧,DLSS 3为160帧。不过UE5这个测试的DLSS 3延迟为58.6ms,而DLSS 2为19.9ms,相对较高。

    09 专业软件测试

    作为“90”级别的显卡,拥有24GB的超大显存,内容创作者领域的应用是必不可少的。我们使用SPECviewperf 13这款工业、专业软件跑分测试。

    对比显卡为iGame GeForce RTX 4090 Vulcan OC显卡、上一代旗舰GeForce RTX 3090 Ti显卡以及上一代游戏旗舰GeForce RTX 3080 Ti显卡。


    在SPECviewperf 13的软件测试中,其实仍然出现不少问题。每款专业软件对于性能提升的程度不尽相同,而且刚刚推出的显卡对软件适配也多多少少存在着问题,

    3DS MAX甚至出现了负增长的情况,所以后续在软件更新完善后将再做测试。不过目前部分软件的分数仍能反映出iGame GeForce RTX 4090 Vulcan OC的强悍之处,其中CATIA相比RTX 3090 Ti提升了55%左右。


    iGame GeForce RTX 4090 Vulcan OC 测试得分


    RTX 3090 Ti 测试得分

    Blender是一款专业的三维渲染软件,本次推出了固定的benchmark跑分软件,省去了安装软件下载素材的麻烦。这款跑分软件只需下载好启动程序,软件会自动渲染测试monster/junkshop/classroom共三个场景。

    上图为iGame GeForce RTX 4090 Vulcan OC显卡得分,分别为6324/2908/2964分,平均4065分;下图为GeForce RTX 3090 Ti显卡得分,分别为3136/1812/1549分,平均2165分。通过平均分的比较不难发现提升非常明显,达到了88%,这对于以帧为渲染单位的动画来说,能够大幅度节省时间。

    10 功耗及温度测试

    功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。


    在本次的拷机测试中,iGame GeForce RTX 4090 Vulcan OC的表现同样出色,在100% TDP满载的情况下,功耗已经来到了530W左右。可见本次RTX 4090超频版对于电源的要求确实非常恐怖。

    另外在满载拷机测试中,iGame GeForce RTX 4090 Vulcan OC峰值温度为71℃,而热点的峰值温度为82℃,这对于RTX 4090以及AD102核心来说,已经是非常不错的了。

    11 赛博堡垒 利刃升级

    本次iGame GeForce RTX 4090 Vulcan OC显卡首测,更多的是围绕新增的DLSS 3进行理论和游戏测试,而实际效果确实令人惊叹。

    不过从测试中也能发现,测试版尚存在着各种问题。此前NVIDIA也公布过一批即将支持DLSS 3的游戏,比如《超级人类》、《生死轮回》、《逆水寒》“拂云庭”、《微软模拟飞行》、《瘟疫传说:安魂曲》这几款游戏都将在10月推出升级DLSS 3的版本,大家也可以自己尝一下,感受帧数暴涨的快感。


    另外还有《切尔诺贝利人》、《原子之心》、《战意》、《赛博朋克2077》、《黑神话:悟空》、《光明记忆:无限》、《永劫无间》、《消逝的光芒2:人与仁之战》、《巫师三》这些有名的作品都将在后续的版本中加入DLSS 3的支持。

    关于RTX 40系显卡升级的Ada架构,其实在最开始大家并不是很看好,毕竟从整体的架构图来看几乎没什么变化,难道NVIDIA已经没有创新了吗?

    可OMM以及DMM引擎的加入,却让游戏帧数再次大幅提升,相比RTX 30系显卡确实带来了成倍增长。即使是受限于CPU的游戏也能突破硬件的显示,《微软模拟飞行》能够在4K分辨率下达到144帧以上的成绩,骇人听闻。


    看来在图形学的进步上,NVIDIA确实没有瓶颈。即便是目前市面上的其他提帧技术,每一次也都慢NVIDIA一步。

    性能方面,其实单看光栅成绩算是中规中矩,毕竟大架构在那摆着。但RTX 40系显卡的真正提升在于进阶的RT Core和Tensor Core上。所以此次RTX 40系显卡,配合DLSS 3“食用”更佳。


    不过对于想着手换显卡的玩家,还是要考虑目前自身硬件能否兼容,大部分AIC显卡的建议电源都在1000W,虽然根据我们的测试成绩来看,低于这个标准的电源依然能够运行,但如果真出了问题是没有保障的。


    最后再来说一说Vulcan系列的外观和智屏升级,相较于RTX 30系显卡来说,这一代没有那么锋芒毕露,整体气势收敛许多,给人一种钢铁堡垒的既视感。而iGame Vulcan智屏的升级,我认为和未来世界的虚拟世界太像了,不得不说这次的整体升级,形与意都非常契合。

    iGame GeForce RTX 4090 Vulcan首测

    FE公版和非公版显卡都会随着今日的性能解禁开始售卖。七彩虹共发布了RTX 4090三个型号,分别为七彩虹iGame火神超频版、iGame水神超频版以及原价的七彩虹战斧豪华版,有兴趣的玩家可以关注一下。

    02七彩虹iGame GeForce RTX 4090 Vulcan OC详细参数

    返回分页阅读本文导航
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • DIY组装电脑
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错