热点:

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

      [  中关村在线 原创  ]   作者:曲楠

    今天是大年初一,在这里先恭祝大家新年快乐。上周我们为大家带来了RTX 50系卡皇RTX 5090 D的评测,今天与大家见面的则是80级游戏旗舰产品,NVIDIA GeForce RTX 5080 16GB FoundersEdition显卡的评测。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    每一代80级显卡都是骨灰级游戏玩家和轻度内容创作者首选,它有着超越上一代旗舰显卡的性能,同时凭借大显存,亦可担当生产力工具,是万元以下最具实力的多面手。

    在整个RTX 50系显卡中,AI的比重都有着明显提升,不管在架构层面、游戏领域,还是内容创作,AI已经做到各个应用领域的底层覆盖,包括任何级别显卡都可使用的DLSS 4 AI多帧生成、针对内容创作的神经网络渲染,以及直播会议应用NVIDIA Broadcast。AI不再局限于文生图和语言问答那么显而易见,而是融入到了我们的日常生活中。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    如果说RTX 40系显卡是靠硬件算力来推动AI工作,那么RTX 50系显卡的硬件算力则成为了AI应用的“保障性”条件,一切的改变都是为了让AI有更充足的“后盾”。而相辅相成的,AI技术的应用,也让计算有了更低的成本。

    每一代公版显卡都是大家最期待的,除了新品极致的性能,还有如艺术品般的产品设计,都让人为之着迷,下面我们先来看看RTX 50系与大家首次见面的公版显卡外观。

    1  NVIDIA GeForce RTX5080 16GB FE概览

    还记得在RTX 40系的公版显卡上,包装采用了礼盒式翻页设计,整体采用了黑色瓦楞纸的环保包装。本次RTX 50系依然延续了环保包装,不过整体更薄,并且采用了淡黄色的浅色系设计,高级感满满。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    从外形来看,这代公版显卡的包装盒有点像骨头,也有网友戏称为“狗骨头”礼盒。虽然整体更轻薄了,不过采用的高强度瓦楞纸叠加在一起,包装的抗冲击力和减震效果都要比传统的显卡包装盒更强。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 16GB FE的整体外观设计沿袭了RTX 40系的风格,不过在细节上仍有较大的变化。整体尺寸为304×137×48mm,采用双槽设计。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 16GB FE整体采用纯黑色雾面金属面板,外框为银色。它最显著的特征就是更改了RTX 30和RTX 40系的轴流式散热设计,采用双风扇在同一侧的双流直通散热设计。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    虽然外部看起来和寻常显卡散热并无区别,不过内部可以看到NVIDIA GeForce RTX 5080 16GB FE的PCB位于正中央,可以让两侧的热流直接通过背板的散热格栅, 而不用再从I/O接口区排出。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    从官方的散热效率说明来看,这种双流直通的散热设计,在GPU功耗提升的过程中,温度能够呈现非常稳定的线性增长,而不是在高于特定瓦数段后温度激增。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    (RTX 5090显卡PCB)

    而为了实现这种双流直通的散热设计,本代RTX 50系显卡在PCB上进行了重新设计。虽然性能功耗均高于RTX 40系显卡,但可以看到PCB被做成了巴掌大小的正方形,正反双面焊接着密密麻麻的元器件,并且排布即为工整。

    我想对于理科生来说,这张PCB本身就是一件艺术品,也是独属于理科生的浪漫。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    近距离可以看到NVIDIA GeForce RTX 5080 16GB FE采用了7叶环形风扇,表面同样为磨砂质感设计,与显卡的金属面板质感相似,一体性非常强。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 16GB FE的I/O接口区能够明显看到,相比于传统散热方式,这次并没有预留排气格栅,非常简约。并且尾部的挡板部位也采用了雾面金属,整卡质感拉满。

    在视频输出接口上,NVIDIA GeForce RTX 5080 16GB FE采用了HDMI 2.1b*1 + DP2.1b*3的四接口设计。

    其中DP 2.1b接口为UHBR20规格,可达 80Gbps 带宽,最高支持8K (7680x4320) @165HzDSC);4K (3840x2160) @480HzDSC)。另外需要注意的是,要达到 80Gbps 带宽需要DP80LL认证的线材。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    本次NVIDIA GeForce RTX 5080 16GB FE的TDP官方给出的为360W,搭载单16pin(12+4)辅助供电。另外值得注意的是,本次电源接口改为了侧面斜插的方式,相比于平行显卡的接口,它能够避免显卡上机后线材与机箱侧板的空间过于狭小,而导致的线材过度弯折问题,从而降低安全隐患。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 16GB FE的背板采用了大面积且密集的散热鳍片,而且从侧面可以看到,每个风扇背后鳍片的中心部位还有大面积凹陷设计。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    整张NVIDIA GeForce RTX 5080 16GB FE显卡,从包装开始可以说细节拉满、质感拉满、用料规格拉满,相应的成本也会更高。不过作为一件“艺术品”来说,它的实用价值更高过观赏价值。下面我们先来看看本代RTX 50系显卡,NVIDIA RTX BlackWell架构带来了哪些变化。

    2  NVIDIA RTX Blackwell架构

    GeForce RTX 50系显卡由全新的NVIDIA BlackWell架构打造,本次评测的RTX 5080则采用GB203核心,配备10752个CUDA,84个RT Cores;336个Tensor Cores和336个纹理单元。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    完整的GB202核心包括12个图形处理集群(GPCs);96个纹理处理集群(TPCs);192个流式多处理器(SMs),和一个512bit总位宽,包含16个32bit内存控制器的内存接口。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    对应到我们熟悉的数字,则是24576个CUDA,192个RT Cores;768个Tensor Cores以及768个纹理单元。由于第5代Tensor Cores采用了更高速的FP4运算,完整的GB202可达到恐怖的4000 AI TOPS;而第4代RT Cores采用的新的几何运算模型,也让它可以达到360 RT TFLOPS。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    RTX 5090 PCB

    另外,每个SM单元中还包含两个FP64内核,总共384个。FP64内核主要目的是确保带有FP64代码的程序可正常运行,并确保准其确性。这对于某些专业领域来说至关重要,比如医学或专业计算领域。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    GPC是GPU中占据主导地位的高级模块,所有关键的图形处理单元都位于GPC中。在RTX 50系中,GPC整体的布局变化不大。

    每个GPC包含一个专用的光栅引擎,两个ROP分区。每个分区包含8个单独的ROP单元和8个TPC,每个TPC包含1个变形引擎和两个SM单元。

    完整的GB202核心还包含128MB的L2缓存。大缓存的变更自RTX 40系显卡便已开始,所有程序都可以受益于这个高速大容量的缓存池,而光线跟踪(特别是路径跟踪)等复杂操作将产生巨大的好处。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    SM单元是GPU架构中的核心组件,在GPU并行处理中发挥着关键作用,它通过其各种核心(CUDA,Tensor,RT),高效的warp调度,内存管理以及对AI等现代工作负载的支持实现大规模并行。本代RTX 50系显卡中SM单元的变化非常大,下面我们详细来了解一下。

    完整的GB202核心包含192个SM单元,每个SM包含128个CUDA核心;1个第4代RT Core;4个第5代Tensor Core;4个纹理单元。1个256KB的寄存器文件和128KB的L1共享缓存,它可以根据图形和计算工作负载的需要配置不同的大小。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    Blackwell架构的SM单元中,INT32整数运算的数量增加了一倍。与Ada架构的SM单元相比,实现了INT32与FP32内核的完全统一。不过在时钟周期内,统一内核只能作为FP32或INT32内核运行。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    Blackwell架构一同推出的还有GDDR7显存,采用pam3信号技术,它有着更高频率与更低电压的特点。

    本代RTX 5090配备28 Gbps GDDR7显存,峰值显存带宽可达1792GB/s/秒,而RTX 5080配备更高的30 Gbps时钟频率的GDDR7显存,峰值内存带宽可达960 GB/秒。结合新的引脚编码方案,GDDR7实现了显著增强的信噪比(SNR)。

    通过增加信道密度、改进的pam3信噪比、先进的均衡方案、重新设计的时钟架构和增强的I/O训练,GDDR7提供了更高的带宽。这些进步还显著提高了能源效率,提供了更好的性能和延长电池寿命,特别是在移动端,或功率受限的系统中。

    Blackwell 第4代RT Core

    在第4代RT Core中,简单来说它相比Ada架构,在渲染光线追踪场景时,提供了两倍光线三角形相交测试吞吐量,并引入了Mega Geometry的结构算法。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    Opacity Micromap Engine

    不透明微引擎在Ada架构中已经引入,这里不再过多讲述,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。

    比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    不过Opacity Micromap Engine可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担。

    RTX Mega Geometry

    除了上面提到的Opacity Micromap Engine,在BlackWell架构中,还引入了Mega Geometry(大型几何)的运算概念。其中包含了Triangle ClusterIntersection Engine、Linear Swept Spheres等新硬件。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    新的Blackwell RT核心包含一个Triangle ClusterIntersection Engine三角形群集交集引擎,它能够进一步加速大型几何的光线追踪,同时它的工作还包含标准的光线三角形交集测试。Linear Swept Spheres则主要用于光线追踪中精细的几何形状,比如发丝。

    RTX Mega Geometry的理念与虚幻5引擎的Nanite虚拟微多边形几何体系统相同,在现代游戏中,模型更加细致,需要渲染的工作量大幅增加,如果全部按照最精细的级别处理,将会耗费极大的计算资源,所以将LOD分级便应运而生。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    简单来说,就是根据一个物体距离摄像机的远近,来调节物体的细节水平。此前《黑神话:悟空》便应用了这样的技术,它消除了LOD的繁琐任务,可以扫描并导入极高精细程度的模型。并且,这不会影响性能。仍然可以获得实时帧速率。

    在RTX Mega Geometry中提供了新的BVH构建功能,它采用三角形集群作为一级基元。新的集群加速结构Cluster-level Acceleration Structures(CLAS)可以从256个三角形空间紧凑批次中生成,然后使用CLAS集合作为输入来构建最终的BVH。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    不过虚幻5引擎并非专为Blackwell而设计,RTX Mega Geometry的工作只是更高效的让游戏引擎调用API由于其输入参数完全由GPU内存驱动,游戏引擎可以在GPU上更高效的运行LOD选择、动画、剔除等逻辑。同时最大限度减少对CPU的往返,进而减少与BVH管理相关的CPU开销。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    然而在更加精细化的游戏引擎中,按照传统的流程,应用程序必须从场景中的每一帧的所有对象中构建一个顶层加速结构。而随着更大的世界规模以及繁杂的场景物体,仅靠LOD分级仍然难以实现质的变化。

    为了解决这个问题,RTX Mega Geometry引入了一种新型的顶层加速结构(TLAS),称为分区顶层加速结构(PTLAS)。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    它无需在每一帧都从头开始构建一个新的TLAS,PTLAS能够辨别从一帧到另一帧,哪些对象是静态的。

    应用程序通过将对象聚合到分区中,并仅更新那些已更改的对象来节省开销。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    例如,游戏可以将静态游戏世界的各个部分放入所属的分区中,同时将动态对象分离到每帧重建的“全局分区”中。与传统的TLAS相比,请求的分区更新越少,节省的运行时开销就越大。

    另外好消息是,RTX Mega Geometry可通过底层API进行扩展支持,适用于所有支持光线追踪的NVIDIA GPU,也就是从图灵架构(Turing)开始。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    不过Blackwell的第4RT Core是专门为RTXMega Geometry而设计的,硬件中的特殊集群引擎实现了几何和BVH数据的新压缩方案,同时是第3RT Core光线三角形相交率的2倍。因此,Blackwell架构可以实现用更小的显存,更高效的处理这些内容。

    Linear Swept Spheres (LSS)

    LSS(线性扫描球体)是Blackwell架构中新增的图形语言,它极大地简化了复杂头发和毛发的渲染开销,并能提升质量。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    此前渲染头发仍然需要最基础的三角形来表达物体,如图所示,发丝中的一个线段需要6个三角形,而一根头发便需要无数个三角形来确保其精度。比如我们的头发则需要600万个三角形来表达。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    Blackwell架构的RT Core引入了LSS新语言的支持,它类似于镶嵌曲线,允许灵活地近似各种链型。并且球体也更适合发行构建。

    LSS的引入可以让发型构建,减少3倍的数据量,速度大约快了2倍,并可以使用更少的显存,获得更高的帧数。

    Blackwell 第5代Tensor Core

    本代架构除了RT Core进行了改进升级,专门负责AI及高性能计算的Tensor Core也迎来了重大升级。

    与NVIDIA Ada Tensor Cores一样,Blackwell架构的Tensor Cores支持FP16、BF16、TF32、INT8、INT4和Hopper的FP8 Transformer Engine。

    Blackwell还增加了对FP4和FP6 Tensor Core操作的新支持,以及新的第二代FP8 Transformer Engine。

    FP4精度支持

    FP4提供了一种较低的量化方法,类似于文件压缩,可以减小模型大小,提升生成速度。与FP16精度(大多数型号发布的默认方法)相比,FP4只需要不到一半的显存。FP4使用NVIDIA TensorRT提供的量化方法,几乎没有质量损失。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    例如,目前最强的AI绘画模型FLUX.dev ,在FP16上需要超过23GB的显存,而这意味着它只能由每一代的期间产品RTX 4090,RTX 5090和专业GPU来支持。

    而对于FP4,FLUX.dev测试对显存的需求将少于10GB,让更多80级和70级的显卡均能在本地运行。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在性能和效果对比上,使用带有FP16的RTX 4090,FLUX.dev模型可以通过30个步骤在15秒内生成图像。使用带有FP4的RTX 5090,只需5秒多一点就可以生成图像。

    DLSS 4

    DLSS 4是本代RTX 50系显卡带来的重大更新,对于玩家来说它也是最能实际感受到的。最新版本DLSS 4带来了新的多帧生成(MFG),具有更快的性能和更低的显存使用等特性。包含超分辨率(SR),光线重建(RR)和深度学习抗锯齿(DLAA)模型,可进一步增强图像质量和稳定性。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    这些新技术由RTX 50系GPU和第5代Tensor Cores支持,并由云端的NVIDIA Al超级计算机提供支持。不过对于手持RTX 40系或更早期显卡的玩家还无缘体会。DLSS 4新增的多帧生成,目前仅支持RTX 50系显卡。

    Multi Frame Generation(多帧生成)

    DLSS多帧生成能够通过每个传统渲染帧,生成多达三帧的额外帧来提高FPS。新的帧生成AI模型相比之前的帧生成方法快40%,使用的显存减少30%,并且每个渲染帧只需要运行一次就可以生成多个帧。高效的AI模型代替了上一代的硬件光流模型,从而加快了光流场的生成速度,并显著降低了生成额外帧的计算成本。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    从生成帧的层面来说,上一代DLSS 3帧生成基于CPU的帧节奏,而这种方式可能会让生成的帧与额外的帧混合在一起,导致每帧之间的帧节奏不太一致,影响平滑性。

    为了解决生成多帧的复杂性,Blackwell架构将帧节奏逻辑转移到显示引擎,使GPU能够更精确地管理显示时序,从而避免与额外帧混合的情况,进而提升帧生成的准确性及稳定性。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    而第5代Tensor Cores拥有更高的计算能力,这使得它们能够更快地执行计算光流和生成多帧的一系列AI模型。并更好地调度DLSS AI处理、图形渲染和帧速度算法。

    Transformer模型

    此前DLSS所用的模型为Convolutional Neural Network,即我们熟悉的卷积神经网络(CNN),CNN的工作原理是将像素局部聚集在一起,并以树的形式从低到高地进行分析数据。这种结构的计算效率很高,这也是为什么它被称为卷积神经网络。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    而DLSS 4引入了基于Transformer的AI模型,用于DLSS超分辨率、DLSS光线重建和深度学习抗锯齿(DLAA),从而提高图像质量和渲染平滑度。基于Transformer模型体系结构的神经网络,擅长处理涉及顺序和结构化数据的任务。简单来说,就是Transformer能够抓住“重点”,可以更好地理解和渲染复杂场景。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    与CNN模型相比,Transformer更容易在更大的像素窗口中识别更远距离的模式,具有一定的学习能力和“前瞻性”。

    本代DLSS 4将基于CNN的神经网络结构,转变为基于Transformer的神经网络结构,在许多场景下图像质量都有着显著提升。

    Shader Execution Reordering (SER) 2.0

    Shader Execution Reordering(着色器重排序)是在RTX 40系架构中引入的一项技术,它可以使带有光追的程序有效地重组GPU上的大量并行线程,以最大限度地利用硬件。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    因为连贯执行神经工作负载的线程可以直接发送到Tensor Core,所以SER也显著加速了神经着色。在Blackwell架构中,SER的核心重排序逻辑效率是原来的两倍,减少了重排序开销并提高了精度。从而进一步提高了该功能的有效性。这项功能更多地是为应用程序开发者而设计,它仅需一个小的API改动,即可执行重排序操作,进而提升总体项目的负载性能。

    3  测试平台简介

    首先介绍一下测试平台,为了保障NVIDIA GeForce RTX 5080 16GB FE这张怪兽的性能发挥,我们的平台也再次进行了全面更新。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    除了NVIDIA GeForce RTX 5080 16GB FE这张显卡,处理器选择了AMD R7 9800X3D游戏神U。同时为了兼顾生产力需求,内存升级到了64GB。

    为了方便观察DLSS 4在画质上的提升和4K高帧率带来的游戏变化。我们选择了EVNIA 32M2N8800 OLED显示器,这款显示器采用了4K@240Hz的高分高刷规格,可完美适配DLSS 4的多帧生成。而99%的DCI-P3色欲覆盖,更可细致入微地观察Transformer模型带来的细节提升。

    本次RTX 50系显卡采用了带宽速率更高的PCIe5.0x16,应用于显卡的PCIe5.0x16带宽速度高达128GB/s,用于固态硬盘的PCIe5.0x4也高达32GB/s,致态TiPro9000,实测顺序读写速度高达14526.95MB/s和13869.24MB/s,达到“满血”级别,可大幅提升操作系统/大型游戏/创作软件的响应和加载速度。

    电源选择了昆仑九重 KE-1300P,它拥有独到的数字电源技术,在实现 1300W 满火力输出的同时,更有着超越白金牌的效率表现,成为高端攒机的理想之选。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    首先看一下GPU-Z的参数,截至目前发稿时,部分参数尚无法识别。NVIDIA GeForce RTX 5080 16GB FE采用GB203核心,采用与上一代相同的TSMC 4nm定制工艺(TSMC 4nm 4N NVIDIA CustomProcess),芯片面积378mm2,相比于RTX 5090的750mm2小了一半。值得注意的是,在RTX 50系显卡中,使用了PCIE×16 5.0带宽。

    显卡拥有10752个CUDA,Boost频率达到了2617MHz。采用16GB GDDR7显存,位宽为256bit,目前由于GPUZ无法识别显存类型,仍然按照上一代来计算,所以显示有误,实际的显存带宽达到了960 GB/s,光栅单元和纹理单元为112/336。

    4  理论性能测试

    下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在针对显卡DX11性能的3DMARK FS套装测试中,NVIDIA GeForce RTX 5080 16GB FE的提升对比RTX 4080 SUPER,在三档分辨率中的提升分别为,8%/16%/19%,综合提升约为14%

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,NVIDIA GeForce RTX 5080 16GB FE相较RTX 4080 SUPER的提升分别为:TS提升12%;TSE提升12%,综合提升约为12%

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    PortRoyal是3DMARK中专门针对光追性能的测试项,NVIDIA GeForce RTX 5080 16GB FE相较RTX 4080 SUPER的提升约为20%

    综合来看,NVIDIA GeForce RTX 5080 16GB FE的理论性能相较RTX 4080 SUPER的提升约为15%

    下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

    NVIDIA GeForce RTX 5080 16GB FE对比RTX 4080 SUPER,提升为20%

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在DLSS的理论测试中,有着较大变化,共分为两种模型。DLSS 2及DLSS 3采用上一代的CNN模型,而最新的多帧生成,则采用了Transformer模型,并且多帧生成可调节生成帧的数量。

    从测试结果来看,DLSS 4 2X基本可以看作是DLSS 3的帧生成,而相比上一代DLSS 3,DLSS 4 4X模式下,帧数综合提升在69%左右,其中在4K和8K提升非常大,在77%左右。而8K分辨率,80及显卡也是史无前例的达到156帧的成绩。

    通过DLSS的理论测试,不难发现8K高刷对于RTX 50系显卡来说早已不是触不可及的目标,而在4K分辨率下,更是突破目前旗舰显示器的上限,达到287帧。

    下面我们先实际测试DLSS 4在游戏中的表现如何,能否达到理论测试的提升效果。

    5 DLSS 4性能测试

    本次DLSS 4在解禁首日,便可支持75款游戏或应用。除了游戏中首发支持外,对于尚未集成的游戏,可在NVIDIA app中进行直接调节非常方便。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在DLSS 4的测试中,首先来看《赛博朋克2077》,目前该游戏随着RTX 50系显卡的性能解禁,也已经更新了DLSS 4,如果首发买了显卡,也可自行测试一番。

    下面的测试中我们会进行多角度对比,来看看不同DLSS的设置下,三档画质的帧数表现。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在所有测试中,为保证缩放比例固定,我们均选择在DLSS 质量模式下进行。

    传统DLSS 2的测试中,使用CNN模型DLSS,可以看到即便是NVIDIA GeForce RTX 5080 16GB FE在4K分辨率下,光追超级画质也仅有64帧,而在光追超速模式下为38帧,还是非常耗费配置的。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    DLSS 3的测试依然为CNN模型,增加帧生成。可以看到DLSS 3已经可以大幅提升帧数,相较DLSS 2,在4K超级画质/光追超级/光追加速 的提升分别为66%/69%/82%综合提升73%,已经是非常惊人的成绩了。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在DLSS 4的测试中,模型更改为Transformer,开启多帧生成,首先测试3X下的表现。

    NVIDIA GeForce RTX 5080 16GB FE在4K超级画质/光追超级/光追加速中,相较DLSS 3帧生成的提升分别为27%/35%/43%,将帧率再次拉至新高度,即便在光追超级画质下,也能达到146帧的电竞级帧率。

    另外注意,在1080p分辨率的超级画质中,已经达到了惊人的471帧!虽然仅仅是超级画质,但这依然是标准的3A游戏《赛博朋克2077》。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    DLSS 4最后的测试为Transformer模型4X帧生成模式,在4K超级画质/光追超级/光追加速中,相较DLSS 4的3X帧生成的提升分别为27%/26%/28%,即便在光追加速画质中,此时光追加速画质也已经来到了127帧。

    并且在4K超级画质中,达到了238帧的成绩,已经将目前旗舰4K@240Hz显示器拉满。而对比DLSS 3帧生成,DLSS 4 4X分别提升为61%/70%/84%

    除了帧数上的提升,DLSS 4对于画质表现如何,下面我们来看看实机截图对比。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    可以看到在采用Transformer模型的DLSS 4中,物体表面的纹理细节更清晰。即便是没有模型面覆盖的锈迹,DLSS 4依然能精准还原。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    同理,墙上的裂纹在DLSS 4中有更明显的痕迹。并且整体画面相较于DLSS 3,更通透明亮。大家也可下载4K图片自行比对。

    《漫威争锋》是近期大火的FPS+MOBA类网游,最初被看作《守望先锋》的替代品,但实际游玩效果,无论画面还是玩法,都更胜一筹。

    截至目前,Steam已经有超过18万评价,整体为特别好评。而且《漫威争锋》是免费网游,大家下载尝鲜DLSS 4。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    首测发布前《漫威争锋》尚未在游戏中集成DLSS 4,这里也举例说明在NVIDIA aoo中如何开启DLSS 4。

    打开NVIDIA app后,切换至图形选项卡,找到对应的游戏,拉至最下方【驱动程序设置】,找到DLSS模型预设,将内部选项全部调节至最新后,开启DLSS帧生成4X,即可享受帧数的暴力加成。

    注意在调节后需重启游戏,且游戏中的DLSS设置及名称不会发生变化,仍然可调节质量、平衡、性能等挡位,但对应的则是DLSS 4X。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    对于一款竞技网游来说,高帧率比画面更重要,使用NVIDIA GeForce RTX 5080 16GB FE在4K分辨率下,DLSS 2质量模式已经能够达到109帧的高帧率。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在4K分辨率下的DLSS 3帧生成模式中,相比DLSS 2在质量模式中提升了33%,达到145帧的电竞级帧率。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    而在DLSS 4 4X多帧生成中,4K分辨率相比DLSS 3质量模式再提升89%,达到274帧。至于大部分超高刷的1080p FPS电竞显示器,538帧也已经完全能够顶格跑满了。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在画面对比中,DLSS 4 4X的四档画质也很难看出区别,角色的头发、衣服,远处的建筑涂绘,基本都和原生画质分毫不差。

    从目前两款支持DLSS 4游戏的测试中可以明显看出,DLSS 4确实有着质的飞跃,在帧数大幅提升的同时,画质相比DLSS 3也更好。

    这里不禁让人感叹:这真是没见过的科技啊!若放在以前,多帧生成是大家想都不敢想的方向,甚至是想不到的方向,然而NVIDIA不仅做出来了,并且效果绝不含糊。只能说NVIDIA再次领先了友商一个时代。

    6  常规游戏性能测试

    除了支持DLSS 4的游戏,我们同样测试了一些主流的3A大作和支持DLSS 3的游戏,为更多玩家提供参考方向。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    《黑神话:悟空》是一款妇孺皆知的国产虚幻5巨制,自带DLSS 3帧生成。我们的两项测试也全部开启帧生成,均为影视级画质。实测NVIDIA GeForce RTX 5080 16GB FE在4K分辨率下最高已经达到了128帧。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    从上下两张图的对比,很难不让人怀疑是我们的成绩放反了。但在《黑神话:悟空》中,至少使用NVIDIA显卡,开启全景光追后,部分帧数反而更高。

    NVIDIA GeForce RTX 5080 16GB FE这张卡的实测结果来看,4K分辨率下开关光追在超级性能模式中帧数差别不大,而从我们此前的测试来看,使用虚幻5引擎的《黑神话:悟空》不同DLSS档位下的画质几乎没有差距。

    如果扔想获得比较高的画质,可以选择性能模式游玩,对于很多风景党来说,可既享受高帧率的同时,又不损失画质。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    《燕云十六声》是网易开发的一款国产武侠大作,在DLSS 2的测试中,2K与4K的成绩几乎完全相同。这绝对是目前游戏优化尚不完善,至少在低分辨率下NVIDIA GeForce RTX 5080 16GB FE的表现应该更好。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    而在DLSS 3的测试中,仍然出现了DLSS 2中的问题。不过在4K分辨率下NVIDIA GeForce RTX 5080 16GB FE大部分DLSS成绩均在200帧左右徘徊,性能还是非常顶的。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    近来同样大火的《三角洲行动》测试中,DLSS 2的结果同样有些意想不到。不过NVIDIA GeForce RTX 5080 16GB FE在4K分辨率DLSS质量模式下,达到168帧的电竞级帧率,性能模式更是达到200帧。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    而在加入帧生成的测试后,低分辨率下的帧数表现恢复了正常。并且NVIDIA GeForce RTX 5080 16GB FE在4K分辨率下的成绩,均在200帧左右。不管是大战场还是战役,都无足为惧。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    《地平线5》也是显卡测试的常驻游戏,其凭借出色的优化,在原生效果下即可跑出优秀的成绩。NVIDIA GeForce RTX 5080 16GB FE在DLSS 3 4K分辨率下再创新高,达到189帧的成绩。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在《刺客信条:幻景》中,我们关闭游戏的自适应帧率,分别测试DLSS不同挡位与原生画质下的差异。

    NVIDIA GeForce RTX 5080 16GB FE在4K分辨率原生画质下即可达到百帧的成绩,而在DLSS超级性能挡位中,突破170帧。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在《无主之地3》中,NVIDIA GeForce RTX 5080 16GB FE相比RTX 4080 SUPER的提升分别为:1080p提升3%;2K提升9%;4K提升16%,综合提升9%。在纯光栅化游戏帧数对比中,《无主之地3》比较能概括RTX 5080与RTX 4080 SUPER的光栅化性能的综合差距。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,虽然游戏较老,但对于性能要求却非常高,本次测试条件为“RTX最高/DLSS质量”。

    性能方面,NVIDIA GeForce RTX 5080 16GB FE相比RTX 4080 SUPER的提升分别为:1080p提升11%;2K提升14%;4K提升18%,综合提升14%。

    7  专业软件测试

    本代RTX 5080拥有16GB的显存,而且新架构对于内容创作软件同样有优化,下面我们分别测试了不同类别的专业软件,来看看实际效果。

    V-Ray6

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    V-Ray6对于GPU的测试分为RTX与CUDA,这里主要看RTX成绩,其中RTX测试相比RTX 4080 SUPER(7047)首测时提升31%左右。

    UL Procyon

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    本次测试UL提供了FLUX.1 Dev绘画模型的FP4测试,该模型在FP16上运行需要超过23GB的显存,而这意味着它只能由每一代的期间产品RTX 4090,RTX 5090和专业GPU来支持。但FP4只需要不到一半的显存。而且FP4使用NVIDIA TensorRT提供的量化方法,几乎没有质量损失。更小的显存消耗让更多80级和70级的显卡均能在本地运行。

    Blackwell架构新的Tensor Core特性不仅让生成所需的显存显著减少,在生成时间也有大幅降低,平均4张图片即可节省20秒时间。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    FP4渲染生成图片

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    FP8渲染生成图片

    在结果对比中,FP8和FP4所生成的图片效果是相同的,在细节和图片精度上均有着良好表现。

    Keyshot 2024

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    Keyshot是一款专注于模拟光线追踪的渲染软件,并可分别调用CPU或GPU进行渲染,下面我们看下最终的渲染时间和结果。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    使用NVIDIA GeForce RTX 5080 16GB FE渲染一张4K分辨率,采样率为1000的图片,最终用时99秒左右。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    而使用CPU渲染(AMD R7 9800X3D),则需要1小时35分钟左右。并且从图片细节来看,两种渲染方式几乎没有不同。所以GPU对于内容创作者来说,效率的提升是不言而喻的。

    8  NVIDIA Broadcast

    NVIDIA Broadcast是一款用于直播或会议的AI软件,目前随着RTX 50系的发布,也进行了版本更新。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    新版NVIDIA Broadcast界面更小巧,纵向布局也更方便视频直播中调节选项。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA Broadcast一些经典效果更方便开启,其中目光接触功能非常适合远程会议,即便眼睛盯着屏幕,也能让参与人员时刻注意到你的眼睛,并且还有一定“大眼”效果。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    虚拟补光仍是测试版功能,它可以在光线较暗的情况下进行面部的AI补光,看你看起来仍然处于光线较好的环境中。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在新的NVIDIA Broadcast中,还增加了GPU利用率的显示,当软件中功能全部打开时,对于GPU的占用率还是非常高的,比较适合会议等不需要过多GPU参与的场景。而如果是游戏直播,则可适当关闭AI效果,以降低GPU利用率。

    不过目前新版NVIDIA Broadcast仍处于测试阶段,实际效果与GPU开销应以正式版为准。

    9  NVIDIA App

    新版的NVIDIA app代替了原来的GFE软件,并且功能更强大,使用起来也更方便。最主要的是,它不用登陆了,即下即用。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    在NVIDIA app首页除了显示最新的驱动信息,还新增了NVIDIA周边软件的下载,比如AI绘画Canvas;图像视频对比工具ICAT;性能测试工具FrameView等等,不用再去NVIDIA官网寻找。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    从APP中强制开启DLSS 4的功能上面已有介绍,不过目前并不是所有游戏和软件均支持此功能。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    系统界面中则更多的是调试类功能,如显示器、视频、超频等。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    其中性能界面提供了较为详细的监控和超频选项,需要注意的是新手如果想尝试超频,尽量不要改变电压,这个选项轻则掉驱动,重则烧毁显卡。

    另外玩家可放心大胆地使用NVIDIA app中的性能自动调优功能,经过NVIDIA反复验证过的参数都是在安全范围内,并且出现问题的话,这张卡仍然具备保修资格。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    NVIDIA信息浮窗是游戏中很好的辅助工具,要开启此功能,需要在APP主界面的设置一栏中,开启按钮,之后按【ALT+Z】即可呼出边栏。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    按【ALT+R】可呼出统计数据的浮窗,功能设置和自由度的调节也非常丰富,最主要的是相当简便。

    10  功耗及温度测试

    功耗测试中,我们选择FurMark2软件进行拷机测试,并采用AIDA64检测信息。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    FurMark软件截至首测时,尚无法检测到GPU信息,部分温度识别有误。我们主要看蓝色的AIDA64信息。NVIDIA GeForce RTX 5080 16GB FE在30分钟左右的烤机测试中GPU温度为71℃;显存温度为70℃。另外可以看到在TDP 100%的满载情况下,整卡功耗为360W。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    除了满载烤机,我们也实测了游戏中显卡的真实数据表现。测试选择《赛博朋克2077》benchmark,4K分辨率下光追加速画质,并开启DLSS 4 4X多帧生成,将显卡性能拉满。

    可以看到NVIDIA GeForce RTX 5080 16GB FE的平均功耗为278W,相比FurMark烤机低了80W左右。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    进行功耗检测的同时,我们也调出了延迟数据,在DLSS 4 4X多帧生成的环境下,游戏平均延迟为48ms左右。证明即便有多张AI生成帧参与到游戏中,我们依然能获得比较“跟手”的操作体验。

    11  DLSS 4再次引领时代!

    从近几代架构来看,其实RTX 30系过渡到RTX 40系,NVIDIA整体是对上一代架构的调整和增补。而本次NVIDIA RTX 50系显卡相比于RTX 40系来说进行了重大调整。

    正如文章开篇所讲,如果说RTX 30系和RTX 40系显卡是靠硬件算力来推动AI工作,那么RTX 50系显卡的硬件算力则成为了AI应用的“保障性”条件,一切的改变都是为了让AI有更充足的“后盾”。而相辅相成的,AI技术的应用,也让计算有了更低的开销。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    从RTX 50系开始,NVIDIA的消费级显卡也正式迈向了AI计算的时代,Blackwell架构将AI融入到了生活中的方方面面。

    其中最显著的就是DLSS 4的多帧生成,相比上周测试的RTX 5090 D显卡来说,豪横的算力让大家借助DLSS 4看到了目前游戏帧数的极限。而RTX 5080则是更接近于玩家实际上手的显卡,DLSS 4的帧数表现也更具参考意义。至于DLSS 4的应用范围,虽然目前支持的游戏有限,不过DLSS这项技术推出本身不过四五年时间,而现在所有3A游戏首发几乎都会搭载DLSS,买了NVIDIA RTX显卡就相当于买了后续软件的优化保障。

    本次DLSS 4之所以有如此大的改变,除了架构本身的变动,另一方面则是从CNN替换到Transformer模型,让AI从中发挥更多作用,不再只是单纯的计算,更利用AI的长处,做到宏观把控,进一步增强生成帧的稳定性和质量。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    相比早先的DLSS 2来说,DLSS 4的多帧生成在画质更好的前提下,还能够让帧率提升至4倍!让4K 200帧的游戏体验不再是梦想。

    而从显示器行业的角度来说,过去高分高刷显示器的性能严重过剩,几乎没有游戏能碰到上限。但随着DLSS 4的推出也鞭策着显示器行业有了更大的进步空间。至少从理论测试来看,8K 150帧已经不是问题了。

    除了游戏方面,FP4运算的引入,也让内容创作进一步提速。更少的显存需求、更快的运算速度,以及无可挑剔的生成质量,都可以让过去常规的任务,提速增量。而对于规模更大的项目,也让不可能变为可能。

    NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代

    抛开AI性能,单纯以光栅化性能来讲,本代RTX 50系显卡的提升确实有限。不过实际证明靠堆核心、堆功耗的方式来提升算力已经达到了瓶颈期,如果真的再出现“双芯”显卡,我想一定不是大家愿意见到的。

    而且坦白讲,让光栅化性能提升到与AI相同的水平,至少需要10年。在芯片规模有限,不大幅增加成本的前提下,AI绝对是最优解。

    本次评测的NVIDIA GeForce RTX 5080 16GB FE及各AIC版本显卡,将于1月30日陆续开售,起售价8299元。想率先体验DLSS 4的爆炸性能,可以关注一下。

    本文属于原创文章,如若转载,请注明来源:NVIDIA GeForce RTX 5080 FE首测 DLSS 4再次引领时代https://diy.zol.com.cn/943/9431203.html

    diy.zol.com.cn true https://diy.zol.com.cn/943/9431203.html report 26081 今天是大年初一,在这里先恭祝大家新年快乐。上周我们为大家带来了RTX 50系卡皇RTX 5090 D的评测,今天与大家见面的则是80级游戏旗舰产品,NVIDIA GeForce RTX 5080 16GB FoundersEdition显卡的评测。每一代80级显卡都是骨灰级游戏玩家和轻度内容创作者首选,它有着超越...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • DIY组装电脑
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错