热点:

    索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露!

      [  中关村在线 原创  ]   作者:曲楠

    首批RTX4090 显卡已经上市一段时间了,相信大家已经被40系显卡强大的硬件性能所折服,NVIDIA Ada Lovelace 架构本次带来的第三代光追技术和DLSS3 技术,再一次重新书写了GPU市场的竞争规则,无论是画面效果还是计算性能,都达到了前所未有的巅峰。今天为大家带来的则是索泰的GeForce RTX 4090 AMP EXTREME AIRO显卡评测。

    在过去的一段时间,我们也陆续为大家带来了多款非公版RTX 4090 的产品评测,不过今天一定是外观设计最为独特的一款产品,下面我们一起来详细地了解一下。

    索泰AMP系列是索泰的旗舰产品系列,曾经只在海外市场发售,近年来,索泰为了丰富次旗舰产品线,将这个系列也带到了国内市场,AMP系列的最大特色便是独特的外观设计。

    从正面看过去,索泰GeForce RTX 4090 AMP EXTREME AIRO的最大特点便是圆润。现如今几乎所有的显卡都采用立体方正的外观设计,索泰的这份圆润可以说是非常难得。显卡的表面采用了温和的曲线纹理过渡,三颗风扇的中心大胆地使用了金色点缀,黑金配色将显卡的档次拉升了一个等级。RGB灯带围绕着三枚风扇,点亮后可以与显卡的其他四个区域的灯光形成幻光同步效果。

    索泰表示GeForce RTX 4090 AMP EXTREME AIRO的创意灵感来自空气动力学,整个显卡的造型都是为了让气流更好地服务于显卡散热,显卡本身的散热系统也进行了全面迭代优化,带来了名为IceStorm3.0 的风扇系统。

    索泰GeForce RTX 4090 AMP EXTREME AIRO 配备了三个11cm直径的仿生盾鳞2.0风扇,支持智能启停,中央的风扇反向旋转,有效减少乱流、降低风扇噪音。三枚风扇的扇叶面积大幅提升,每一片扇叶的曲率和鳞状仿生条纹都能够大幅提升进风量、风压和风流,同时也增加了风扇的厚度,加深了风扇外罩,让气流更加集中,使风扇产生的气流集中压向散热鳍片,从而提升散热效率。

    超大VC均热板

    9热管豪华阵列

    加厚散热鳍片

    在内部的散热模组上,索泰GeForce RTX 4090 AMP EXTREME AIRO 使用了9根冰脉2.0热管豪华阵列,通过大面积的VC均热板覆盖核心和显存部位,并且加厚、加高了散热鳍片,让热量能够以最快的速度从核心向外扩散。

    索泰GeForce RTX 4090 AMP EXTREME AIRO的四周均设有导流通道,气流可以吹透所有鳍片,从各个方向流动排出,减少显卡内部的热量堆积,降低GPU核心的温度压力。

    索泰GeForce RTX 4090 AMP EXTREME AIRO 的背部设计同样出彩,流线型的线条贯穿于显卡背板,“LIVE TO GAME”的品牌宣言和支持RGB灯光效果的索泰LOGO遥相呼应,位于散热鳍片右侧的线条纹理同样支持RGB灯光效果。

    显卡右侧背板采用镂空设计,便于风扇从显卡背面抽取冷空气,提高散热效率。

    显卡顶部采用半透明彩虹色涂层,设计灵感来源于北欧神话中的彩虹桥,点亮时透射出惹眼的光芒,旖旎斑斓,呈现出独特的美感。即便是在没有点亮的状态下,也能够感受到它反射出的流光溢彩,个性十足。

    中心位置照例是一组16pin电源接口,索泰GeForce RTX 4090 AMP EXTREME AIRO 采用了高成本镀金12+4P供电接口,接口的金属端子整体镀金,减缓氧化、降低电源线和接口的接触阻抗,减少发热量。另外显卡附带了一组16pin电源转接线,最高可提供600W供电能力,为后续超频奠定基础。

    接口右侧是BIOS切换按键,索泰GeForce RTX 4090 AMP EXTREME AIRO 提供了加速和静音两种模式,既可以通过这个物理按键切换,也可以在索泰的Firestorm控制软件中调整,这一点比其他很多竞品做的方便。

    索泰GeForce RTX 4090 AMP EXTREME AIRO 采用三槽设计,提供了三个DP1.4和1个HDMI2.1 显示输出接口,索泰的LOGO也在这里有直接体现,设计细节到位。至于呼声较高的DP2.0,其实目前绝大部分消费级游戏显示器都没有实装,且DP1.4a标准也能够支持8K60Hz刷新率的显示器。所以,综合来看,绝对够用。

    总体来说,索泰GeForce RTX 4090 AMP EXTREME AIRO 的散热器高度和厚度都相当夸张,显卡的整体尺寸为355x166x72mm,对机箱的空间要求还是比较大的,当然这也是所有RTX4090共同的问题。

    本次FireStorm软件也进行了更新,界面更直观,UI设计也更好看了。软件共分为五大栏,首页的状态栏可显示显卡详细信息,包括温度、风扇、核心频率等实时信息。

    风扇一栏同样可以显示当前转速信息,更重要的是可以手动调节风扇转速曲线或者手动控制,这对于超频的用户来说比较重要。

    性能一栏便于玩家手动超频,不过超频有风险,还需谨慎。如果是超频新手,可以先试试简单拉一点频率及功耗,而电压则需要一点一点手动增加,直至参数稳定即可,不要一下都拉满。

    而灯效部分其实才是玩家调节最多的地方,本次FireStrom提供了丰富的选项,可以整卡灯效调节,也可以分区域调节。

    不得不说,卡身整体柔中带刚加上彩虹桥式的灯效,相比常规方方正正的显卡更具观赏性。最后一栏则是软件方面的相关设置,就不在这里多说了。

    下面我们来看一下此次推出NVIDIA Ada Lovelace架构,我们先从Ada Lovelace这个人讲起,相较于Ampere,这位似乎大家更陌生一些。

    Ada Lovelace(1815-1852)是英国数学家、计算机程序创始人,建立了循环和子程序概念,被称为世界上第一位程序员

    Ada从小对数学有极高天赋,其父称她为“平行四边形公主”,后来的合作伙伴Charles Babbage称她为“数字女巫”。在19岁时Ada嫁给了自己曾经的科学家庭教师,婚后的她对数学热情不减。

    1842年到1843年花了9个月时间翻译了Babbage的《分析机概论》的备忘录,写了很多注记,其中给出了用计算机进行Bernoulli数求解的详细说明。由此,Ada被广泛认为是世界上第一位程序员。

    而以她名字命名的语言——ada语言,已经成为了美国军方开发战斗机等尖端武器的语言。

    从几行简短的生平简介中,不难看出Ada的生命虽然只经历了短暂的37个春秋,但却足以被后人铭记。

    这也是为什么此次NVIDIA RTX 40的先行宣传中,用到了“以未来敬传奇”的slogan,下面我们详细剖析一下,这次的Ada Lovelace还有哪些创新和超越。

    本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4nm定制工艺(TSMC 4 nm NVIDIA Custom Process),旗舰核心AD102达到了恐怖的760亿个晶体管,而在RTX 30系显卡中为280亿个。

    与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可达到90-TFLOPS的着色器数据吞吐量,而本次发布的GeForce RTX 4090则达到83-TFLOPs,相比上一代NVIDIA Ampere则只有40-TFOPs。

    完整的AD102核心共有18432个CUDA,其中包含12个图形处理集群(GPCs), 72个纹理处理集群(TPCs), 144个流式多处理器(SMs)。144个第三代光追核心(RT Cores)、576个第四代张量核心(Tensor Cores)。另外可以看到Boost频率也从1.9GHz猛增到了2.5GHz。

    另外一点在架构图上没有体现的是,AD102核心还包含288个FP64双精度浮点核心(每SM 2个),用来确保FP64代码正确处理,包括FP64张量核心代码。

    通常来讲,单精度浮点运算会用于深度学习模型训练,而双精度浮点运算则用于数值模拟工作。通常游戏卡都会砍掉FP64,这既节省了成本,又对游戏本身没有影响。而专业卡都保留有FP64,目的就是为了精度更高训练与计算。

    此次资料中只提到了AD102核心搭载了288个FP64,尚不知道后续的推出的产品有无变更。

    了解了完整的GA102核心,我们再来看一下RTX 4090的核心,其实知道了RTX 4090的参数,我们大概也能了解到后续可能推出的“Ti”系列究竟相差在哪。

    相比完整的GA102来说,RTX 4090共有16384个CUDA,其中包含11个GPC、64个TPC以及128个SM单元,第三代RT Cores为128个,第四代Tensor Cores为512个。

    其实根据完整的架构图就能看出,此次Ada架构整体结构性的改动并不大,这一点从SM单元便能清晰印证,同样的FP32 CUDA核心,同样的FP32/INT32混合CUDA核心,同样的L1级缓存等等。当然,每个SM单元内部的Tensor Core升级为第四代。

    不过变化最为显著的,则是第三代光追核心,我们结合两代架构来看。在第二代光追核心中,包含负责边界交叉测试的Box Intersection Engine引擎,和负责三角形交叉测试的Triangle Intersection Engine引擎。

    而在第三代光追核心中,还增加了两个新的引擎:Opacity Micro-Map Engines(OMM)和Displaced Micro-Mesh Engines(DMM),这两个新的硬件单元可以极大地提升光追性能(具体原理后文详细介绍)。

    至此,每2个SM单元组成一个TPC单元,每6组TPC单元组成一个完整的GPC顶层单元(在部分核心中,会出现5组TPC组成一个GPC单元的情况)。

    而每个GPC单元又搭载一个独立的光栅引擎、两组ROP分区(每组包含8个ROP单元)。

    过多关于数数的部分就不再介绍了,毕竟此次架构图的大面上与NVIDIA Ampere架构基本相同,下面我们分别来看看,除了性能Ada架构还有哪些升级。

    Shader Execution Reordering (SER)着色器执行重排序

    SER主要的作用是提升着色器性能,它可以将效率低下的工作负载,动态重组为更高效的工作负载。主要针对光线追踪的性能提升非常大。

    简单地说,GPU在执行类似工作的时候效率最高。但随着光追效果越来越强大,每个场景可能有数百万条光线照射在不同材质上,而我们知道不同材质的反射率,以及反射效果也是不同的。所以这样就为着色器创建了大量的、发散的,效率低下的工作负载。

    SER则可以将这些杂乱的指令重新分门别类,动态重组为更高效的工作负载。根据NVIDIA的说法,SER可将着色器性能最多提升2倍,并将游戏帧率最高提升25%。

    举个简单的例子,当光线第一次从发射端到碰撞端是非常有规律的射线,而碰撞到物体后的二次光追,则会出现大量发散的、无规律的反射,这对于光追负载是非常高的。而从图中便能看到,SER可以将这些指令进行二次排序,以发挥出着色器的最大性能。

    不过好在这么实用的功能并不是RTX 40系的专利,它是一个易于集成的SDK,目前需要游戏开发商集成在游戏中。另外由于它是一个通用的逻辑,后续也有可能直接集成在Windows的API中,这样游戏开发者就无需特意引用,直接调用系统API即可。

    可以说SER对于手持RTX 20系及以上(能够开启光线追踪)的N卡用户来说,是极大地福音。毕竟免费提升的光追性能,谁不喜欢呢。

    第三代 RT Cores

    RT Core的作用在于更快的光线追踪计算能力,如果说在RTX 30系显卡中,想要畅享4K高帧率游戏有点吃力,那么RTX 40系显卡中,将显得轻而易举。

    在GeForce RTX 4090这张显卡上,达到了191 RT-TFLOPs的处理能力,而RTX 30系显卡最快处理能力为78 RT-TFLOPs,足足为2.4倍。并且根据NVIDIA的官方说法,第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍。而这只能说明,这张4090并非Ada Lovelace架构的最终形态。

    Opacity Micro-Map Engines(OMM)

    在第三代RT Cores中引入了两个重要的硬件单元,首先是Opacity Micro-Map Engines,可以理解为微映射透明度引擎,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。

    比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的。

    不过Opacity Micro-Map Engines可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担。

    Displaced Micro-Mesh Engines(DMM)

    Displaced Micro-Mesh Engines可理解为微网格置换引擎,它构建光线追踪的BVH(Bounding volume hierarchy)的速度提高了10倍!所使用的的显存减少了20倍!

    DMM由第三代RT core本地处理,与前几代相比,它只使用基本三角形渲染复杂几何图形,极大减少了存储和处理需求。

    具体的工作原理从图中一目了然,新的DMM可以将面数非常多的复杂图形做简化,创造出简单的模型,但整体的光线追踪效果不变。

    通过一些模型数据我们可以具体看到,新的DMM将模型简化了多少。原本1100万三角面的模型,经过简化后,只有15万左右的微网格,BVH的构建速度提升了8.5倍,小了6.5倍。

    而这还不是最夸张的,越复杂的模型往往优化的效果越好,在官方展示的这几组对比示例中,最快可提升大于15倍的速度,容量简化20倍的模型。

    第四代 Tensor Cores

    除了光追单元的升级外,第四代张量核心的升级更加恐怖。它采用了新的FP8张量引擎,在GeForce RTX 4090这张显卡上,吞吐量达到了1.32 Tensor petaFLOPs,提高了5倍。

    注意这里的单位——petaFLOPs。以往的TFLOPs为万亿次浮点运算,而petaFLOPs则为千万亿次浮点运算。

    DLSS 3 神经网络渲染新时代

    本次推出的DLSS 3也是RTX 40系一大卖点,从DLSS 2.3直接迈入了3.0版本,也能看出此次的升级之大。而DLSS 3也被NVIDIA官方称为神经网络渲染新时代。

    全新的DLSS 3在原有的DLSS超分辨率的基础上,添加了光学多帧生成技术,以生成全新的帧,而不像原来只能生成像素。

    DLSS 3结合了DLSS超分辨率、DLSS帧生成和NVIDIA Reflex这三大技术,能够重建八分之七的像素,极大提高性能。

    在GPU受限的游戏中,比如2K分辨率及以上的更高分辨率,DLSS 2能够将帧率提高2倍,DLSS 3则能够提升4倍。

    本次DLSS 3跨越了一个大版本,从想法和原理上也再度升级,完全“猜想”1帧的技术,我们解释起来简单,但实施起来需要大量的推理与演算,以及绝对超前的想法。

    不过“凭空”生成的1帧,在延迟上绝对要比DLSS 2高。所以此次完整的DLSS 3中,捆绑了NVIDIA Reflex,可以有效帮助减小延迟。

    这也不负NVIDIA给它起了个“神经网络渲染新时代”的名号。纵观目前市面上的XeSS、FSR技术,DLSS绝对称得上“巨人的肩膀”。当然,连年的创新,苦的是手持上一代显卡的玩家,想体验DLSS 3的帧生成,目前唯一的办法就是购入一张RTX 40系显卡。

    New Optical Flow Accelerator

    New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的,这也是为何DLSS 3中的帧生成为RTX 40系显卡独享。

    光流加速器在原本DLSS 2的基础上,还可以计算两个连续帧内的光流场,能够捕捉游戏画面从第1帧到第2帧的方向和速度,从中捕捉粒子、反射和光照等像素信息。并分别计算运动矢量和光流来获得精准的阴影重建效果。

    以《赛博朋克2077》为例,在第一帧,光流加速器会捕捉到每一个像素中的粒子、反射和光照等信息。并在第二帧中查找匹配的像素区域,计算帧之间的差值。

    如果说原来DLSS 2能够“猜”出一张图剩下的像素,那么DLSS 3除了这些,还能够“猜”出下一帧的画面。

    另外由于DLSS 3的帧生成是在GPU中处理和运行的,所以即使遇到CPU瓶颈的游戏,AI同样能够提升帧率。这也是为什么在此次发布会中说到,DLSS 3能够突破CPU的限制来提升帧数。

    双AV1编码器

    本次升级的第八代NVENC编码器可以说是直播、视频、后期工作者的极大福音。它首次加入了对AV1编码的支持,最显而易见的效果就是直播。

    相比传统的H.264编码,AV1编码的效率平均提升了40%,在同码率下AV1编码的画质将更好。目前大部分直播的分辨率和清晰度,均受限于平台规定的最大比特率。以Twitch限制的8Mbps为例,可以看到在同等带宽下,同为2K 60帧的画面,采用AV1编码的清晰度明显比H.264更高。

    说起直播,OBS相信大家都不陌生,在10月份即将发布的补丁中,OBS就加入了对NVENC的AV1编码支持

    当然,直播只是我们更容易见到的AV1优势,在视频工作的所有环节,AV1编码都可以带来极大提升。

    所以,如图所见。NVIDIA已经为广大用户铺好了一条完整的生态链,从编码API、软件、平台到播放器,将全面支持AV1编码。

    另外再说一下NVIDIA一直强调的双AV1编码。顾名思义,即部分显卡内搭载了两个编码器,它所带来的效果也是显而易见的。

    首先,根据官方宣传的,在4K H.265的导出速度上,RTX 4090是RTX 3090 Ti的2.2倍;在8K H.265的导出速度上更是达到了2.5倍。这部分的提升,大家常用的剪映同样适用,感兴趣的用户不妨亲自体验一下。

    除了导出速度,8K 60帧的视频录制在以前简直难以想象,而双编码器的好处就是可以将图像一分为二,两个编码器分别处理7680×2160的图像信息,最后拼合完整。

    关于编码部分,可能大部分用户的感受不深,但当有一天,你想录屏的时候,却发现显卡不支持,才会发觉它的重要性……

    随着图像逐渐进入到超清时代,硬件编码和渲染几乎已经成为不可或缺的帮手。虽然论质量,硬件编码仍不及CPU软编,但软编做到了极限画质,也要承受时间的无穷长。

    甚至在一张8K渲染图中,两种编码方式的时间差距就已经达到了几个小时,遑论一段10秒的CG动画。在不断进步的硬件编码中,质量和时间也在不断地被挑战和刷新。

    首先介绍一下测试平台,为了保障索泰GeForce RTX 4090 AMP EXTREME AIRO 的性能发挥,我们的平台也再次进行了全面更新。不过由于手头上没有旗舰处理器,采用了12代中高端产品,并且在电源上进行了着重升级,采用了华硕ROG雷神2代1600W的钛金牌全模组电源。

    首先看一下GPU-Z的参数,索泰GeForce RTX 4090 AMP EXTREME AIRO 采用AD102核心,采用TSMC4nm 定制工艺(TSMC4 nm NVIDIA Custom Process),芯片面积608平方毫米,这里相对于RTX30 系的GA102的628平方毫米更小。

    拥有16384个CUDA,相比RTX3090 Ti 的10752多52%,Boost频率达到了2580MHz,相比公版的2520MHz有一定的提升。

    采用24GBGDDR6XMicron显存,位宽为384bit,显存带宽达到了1008.4GB/s,光栅单元和纹理单元为176和512。

    下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

    在针对显卡DX11性能的3DMARKFS 套装测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 的提升非常惊人,可以看到在分辨率越高的情况下这张显卡提升越大,其中FS提升了63%;FSE提升了75%;FSU则暴力提升了79%。

    综合来看,在整个FS套装的测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相较GeForce RTX 3090 Ti 的提升约为72%。

    3DMark FireStrike 系列的测试可以看作是大部分过去流行热门游戏的基准,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比上一代旗舰RTX3090Ti 以及RTX3090 都有着巨幅性能提升。

    而在针对DX12环境下的TimeSpy 和TimeSpy Extreme 测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相较GeForce RTX 3090 Ti 的提升分别为:TS提升68%;TSE提升74%,综合下来约为71%。

    3DMarkTime Spy 系列是针对DX12的基准测试,能够代表目前以及可预见未来游戏大作的性能提升表现,索泰GeForce RTX 4090 AMP EXTREME AIRO 的成绩同样惊人。

    PortRoyal是3DMARK中专门针对光追性能的测试项,索泰GeForce RTX 4090 AMP EXTREME AIRO 相较GeForce RTX 3090 Ti 的提升约为78%。

    本次测试我们还引入了3DMark最新的SpeedWay性能测试模块,SpeedWay使用光线追踪和实时全局照明来渲染逼真的光照和反射效果。它基于新的DirectX12 旗舰版功能(如网格着色器和可变速率着色)来优化性能和视觉质量,是测试显卡全方位综合性能的基准测试工具。

    不过由于这个工具刚刚发布,所以我们暂时没有更多其他产品的跑分进行对比,这里的数据供大家参考。

    综合来看,索泰GeForce RTX 4090 AMP EXTREME AIRO 的理论性能相较GeForce RTX 3090 Ti的提升约为74%。

    索泰GeForce RTX 4090 AMP EXTREME AIRO DLSS 3 4K

    在本次测试中,我们使用3DMARK的测试版进行了DLSS3 的相关测试。在4K分辨率下,DLSS关闭为57.34帧,DLSS3 开启后为170.27帧,提升幅度高达197%!

    RTX3090 Ti DLSS 2 4K

    另外我们也测试了GeForce RTX 3090 Ti 在该程序下成绩,其中DLSS关闭为32.73帧,由于不支持DLSS3,所以在DLSS2 下的成绩为83.63帧。

    索泰GeForce RTX 4090 AMP EXTREME AIRO 在开启DLSS3 后,相比关闭提升了197%;而GeForce RTX 3090 Ti 在开启DLSS2 后,相比关闭提升了155%。

    当然DLSS3最夸张的还不止数字上这么简单,我们再来看看这张图。

    索泰GeForce RTX 4090 AMP EXTREME AIRO DLSS 3 8K

    在8K(7680x4320)分辨率下的 DLSS3 测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 在DLSS关闭的情况下仅有13.18帧,已经无法正常运行游戏,而在开启DLSS3 后,一跃达到了92.09的流畅水准,提升了599%!

    8K 下的测试成绩意味着索泰GeForce RTX 4090 AMP EXTREME AIRO 已经可以满足8K@60fps的游戏运行及格线,让现在的8K电视等设备也可以用于游戏需求,为玩家带来更加极致的游戏画面。

    由于本次RTX40 系加入了DLSS3 新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

    首先在《地平线5》中,可以明显看到,不止在1080p分辨率下,即使在2K分辨率中,受限CPU的情况依然明显。作为一款标准的3A游戏,在4K分辨率下依然可以跑到135帧,这在以前绝对是无法想象的。《地平线5》吸引玩家的关键因素不仅仅是赛车竞速,更是制作组在游戏中带来的精美绝伦的风景,在4K分辨率下,墨西哥风光将更加逼真,更加引人入胜。

    性能方面,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090 Ti 的提升分别为:1080p提升52%;2K提升55%;4K提升73%,综合提升60%。

    在《刺客信条:英灵殿》中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090Ti 的提升分别为:1080p提升58%;2K提升64%;4K提升47%,综合提升57%。在众生平等《英灵殿》中取得如此巨额的画面帧数改进属实难得,索泰GeForce RTX 4090 AMP EXTREME AIRO 即便在4K分辨率下也能够获得超过100fps的帧率表现,非常不容易。

    在《无主之地3》中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090 Ti 的提升分别为:1080p提升46%;2K提升67%;4K提升66%,综合提升60%。

    《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。所以测试帧数相对较低,但实际游戏配置相当亲民。

    性能方面,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090 Ti 的提升分别为:1080p提升70%;2K提升77%;4K提升73%,综合提升76%。

    在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

    在《边境》中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090 Ti 的提升分别为:1080p提升82%;2K提升89%;4K提升85%,综合提升85%。

    《光明记忆:无限》和《边境》两款最早的光追测试程序,到今天也已经陪伴着NVIDIA走过了三代光追核心,索泰GeForce RTX 4090 AMP EXTREME AIRO 的提升是肉眼可见的,从初代只能保证1080P下的流畅运行,到如今在4K分辨率下获得87fps的运行帧率,能够切实感受到NVIDIA的技术“大跃进”。

    由于本次新技术DLSS3的推出,将有35款游戏将于近期推出全新的DLSS3功能,本次我们也拿到了部分游戏的测试版。

    另外《超级人类》、《生死轮回》、《逆水寒》“拂云庭“、《微软模拟飞行》、《瘟疫传说:安魂曲》都将在10月陆续发布支持DLSS3 的版本。

    其中《赛博朋克2077》、《F122》、《瘟疫传说:安魂曲》、《微软模拟飞行》、《逆水寒》本次进行了DLSS3 的测试,另外Unity和虚幻引擎也提供了本次的测试程序。

    本次DLSS3 的测试图表比较繁琐,并且增加了1%Low FPS 和延迟的测试,普通的FPS好理解,那么这个1%Low FPS 是什么意思。

    首先,游戏Benchmark通常测试的FPS即为,一段时间内的游戏平均帧。而1%Low FPS 则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。

    其实简单来说,这两个数值都不能代表我们在游玩时,具体哪一刻的感受,但FPS更注重整体,而1%Low FPS 则是从最差的里面求平均,更谨慎一些。

    看懂了1%LowFPS,我们再来看这张图表,在坐标轴左侧的为延迟(越低越好),坐标轴右侧的均为帧数(越高越好),并且由于牵扯到正负坐标,所以两侧的值有可能会不同。

    Frameview中的测试结果为小数点后三位,为了方便观看,这里在帧数上进行四舍五入,延迟则保留小数点后一位。由于目前测试DLSS3 的游戏均为测试版,所以难免出现BUG。

    在《微软模拟飞行》中,在开启和关闭DLSS2 的时候,分数几乎无变化。这款游戏是极度吃CPU资源的游戏,如果瓶颈卡在处理器上,那么传统的DLSS2 的确无法提供更多的帧数加成。

    而在DLSS3 中,我们能够明显看到帧数的大幅提升,要知道我们所有DLSS3 的测试均在4K分辨率下进行。

    不过帧生成并不是毫无弊端,这也是为什么此次测试加入了延迟。并且在开启DLSS3 后,NVIDIAReflex 是捆绑开启的。但相对于DLSS2 增加的这点延迟,在实际体验中的感受并不强。

    在《赛博朋克2077》中的数据反映比较真实,可以看到在DLSS关的光线追踪最高的情况下,即便索泰GeForce RTX 4090 AMP EXTREME AIRO 显卡也只有38帧,并且延迟达到了52.5毫秒。

    而在开启DLSS3 后,帧数为137,提升了261%。虽然相比DLSS2 的延迟高了9.5毫秒左右,但相比关闭DLSS来说,依然维持在较低的水平。DLSS3 直接将索泰GeForce RTX 4090 AMP EXTREME AIRO 的运行帧数从及格线拉到了电竞水平,提升相当明显。

    《瘟疫传说:安魂曲》是即将发布的一款游戏,在DLSS3 和DLSS关之间的帧数提升,同样达到了136%。不过在这款游戏中,DLSS3 相比DLSS2 的延迟增加了12.2ms,在我们测试过的4090显卡中属于比较低的水平了。

    目前《F122》的数据测试同样有问题,在DLSS关和DLSS2 中均没有延迟数据。

    这一组主要看帧数的提升。其中DLSS3 相比DLSS关的帧数提升了143%,相比DLSS2 的提升也达到了22%。赛车游戏的帧数提升虽然不像FPS那样可以提升游戏胜率,但是画面越流畅,真实度就越强,DLSS3 给《F122》带来的改善相当巨大。

    最后则是国产游戏《逆水寒》的光追测试,本次我们选择的测试Demo采用了真正的全局光照。

    在尝试关闭DLSS运行后,帧数仅有个位数,而延迟早已上万。还记得在纯光线追踪软件中测试的《光明记忆无限》和《边境》,在本次只有DLSS2 的情况下都能够达到80帧左右。而《逆水寒》这款真正意义上的全局光照,在DLSS2 开启后仅有48帧左右,着实恐怖。不过在开启DLSS3 的情况下,4K分辨率也来到了80帧,已经可以保证基本的游戏体验了。

    画质方面,在上图中我们截取《赛博朋克2077》中的一角,可以看到在两种DLSS模式下,相较原画质几乎没有明显变化,只在栅栏处的光影效果有所不同,但对于如此大幅度的帧数提升,这点瑕疵几乎可以忽略不计。

    RTX3090 Ti即时帧数39帧

    索泰GeForce RTX 4090 AMP EXTREME AIRO 即时帧数98帧

    在Unity的测试程序中,有一组实时演算的光线追踪+DLSS的帧数对比。索泰GeForce RTX 4090 AMP EXTREME AIRO 在开启DLSS3 后,实时帧数为98;而GeForce RTX 3090 Ti在开启 DLSS2 后,实时帧数为39帧,提升约为151%。

    DLSS关76帧

    DLSS2 147帧

    DLSS3 186帧

    在UE5提供的测试游戏中,方便地给出了DLSS的快捷测试,这里分为DLSS关(超分辨率关+帧生成关+Reflex关);DLSS2(超分辨率性能+帧生成关+Reflex开);DLSS3(超分辨率性能+帧生成开+Reflex开)三档测试。

    其中,索泰GeForce RTX 4090 AMP EXTREME AIRO 在DLSS关的即时帧数为76帧,DLSS2 为147帧,DLSS3 为186帧。不过UE5这个测试的DLSS3 延迟为50.92ms,而DLSS2 为17.00ms,相对较高。

    从DLSS3 的整体测试中能看到,在开启DLSS3之后画面的延迟都有小幅度的提升,不过在大多数游戏中,这点延迟其实不会造成过多的负面影响,但是其提升的帧率将会实打实地带来更为流畅的画面,孰轻孰重不必多说。

    作为“90”级别的显卡,拥有24GB的超大显存,内容创作者领域的应用是必不可少的。我们使用SPECviewperf13 这款工业、专业软件跑分测试。

    对比显卡为索泰 GeForce RTX 4090 AMP EXTREME AIRO 显卡、上一代旗舰GeForce RTX 3090 Ti 显卡以及上一代游戏旗舰GeForce RTX 3080 Ti 显卡。

    在SPECviewperf13 的软件测试中,每款专业软件对于性能提升的程度不尽相同,其中SW相比RTX3090Ti 提升了35%,MAYA相比RTX3090Ti 提升了42%,CREO相比RTX3090Ti 提升了41%,CATIA相比RTX3090 Ti 提升了56%,3DSMAX 相比RTX3090Ti 提升了54%。

    索泰GeForce RTX 4090 AMP EXTREME AIRO 测试得分

    RTX3090 Ti 测试得分

    Blender是一款专业的三维渲染软件,本次推出了固定的Benchmark跑分软件,省去了安装软件下载素材的麻烦。这款跑分软件只需下载好启动程序,软件会自动渲染测试monster/junkshop/classroom共三个场景。

    上图为索泰GeForce RTX 4090 AMP EXTREME AIRO 显卡得分,分别为6386/2962/2993分,平均4113分;下图为GeForce RTX 3090 Ti 显卡得分,分别为3136/1812/1549分,平均2165分。通过平均分的比较不难发现提升非常明显,达到了90%,这对于以帧为渲染单位的动画来说,能够大幅度节省时间。

    在专业软件的测试中也可以感受到索泰GeForce RTX 4090 AMP EXTREME AIRO 的优秀性能表现,对于应用这些软件的专业用户来说,它所带来的效率提升是相当明显的。

    功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

    在本次的烤机测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 的表现同样出色,在100%TDP 满载的情况下,功耗来到了450W左右,与公版相当,但对于电源的要求也非常恐怖了。

    另外在满载拷机测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 峰值温度为64.6℃,这对于RTX4090 以及AD102核心来说,表现非常出彩。

    在RTX4090 系列正式发布前,谁也不会相信老黄能够给AdaLovelace 架构带来如此优秀的性能表现,在同样的功耗下,AdaLovelace 相比上一代Ampere有超过2倍的性能提升,这样的代际变化即便是对NVIDIA来说也过于夸张了。

    第三代光追核心与DLSS3 的加入,让AdaLovelace 如虎添翼,直接把游戏画面的竞争拉升到了8K级别,从40系显卡开始,游戏玩家对高分辨率、高刷新率的渴求将走上一个新的台阶,而能够再一次惊艳玩家眼球的厂商,恐怕还是NVIDIA自己。

    回归到我们今天的主角索泰GeForce RTX 4090 AMP EXTREME AIRO,这款显卡在方正造型大行其道的今天可谓是一股清流,圆润的外表以及独特的RGB设计理念足以让众多颜值党为之沉沦,这样的设计并不是每一个品牌都敢于拿出手的,这里必须为索泰的大胆点个赞,显卡市场需要更多索泰这种敢于尝试的厂商。

    在圆润的外表下是性能和散热的锋芒,索泰GeForce RTX 4090 AMP EXTREME AIRO的频率虽然只比公版显卡高了一点点,但是它的性能和散热表现却同样出类拔萃,风扇的噪音控制也相当令人满意,可以称得上是取得了性能和噪音之间的完美平衡。

    圆润外表下的锋芒毕露是对索泰GeForce RTX 4090 AMP EXTREME AIRO 的最好诠释,如果你追求个性化的外观设计,并且在意显卡的性能和散热表现,索泰GeForce RTX 4090 AMP EXTREME AIRO 一定不会让你失望,目前这款显卡已经正式上市销售,感兴趣的朋友不要错过!

    本文属于原创文章,如若转载,请注明来源:索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露!https://diy.zol.com.cn/805/8054853.html

    diy.zol.com.cn true https://diy.zol.com.cn/805/8054853.html report 24794 首批RTX4090 显卡已经上市一段时间了,相信大家已经被40系显卡强大的硬件性能所折服,NVIDIA Ada Lovelace 架构本次带来的第三代光追技术和DLSS3 技术,再一次重新书写了GPU市场的竞争规则,无论是画面效果还是计算性能,都达到了前所未有的巅峰。今天为大家带来的则是索...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    • 第1页:索泰RTX 4090 AMP评测
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • DIY组装电脑
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错