热点:

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

      [  中关村在线 原创  ]   作者:曲楠

    不久前NVIDIA刚刚发布了RTX 40系旗舰显卡GeForce RTX 4090,其理论性能相比RTX 3090 Ti提升多达70%左右,时隔一个月,今天我们为大家带来了NVIDIA GeForce RTX 4080 16GB显卡的首发评测。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    其实“90”级别产品在NVIDIA早几代的型号中,属于TITAN级别,其超大显存是标志性差别。而“80”级产品才是玩家认知中的旗舰。

    本代NVIDIA GeForce RTX 4080 16GB显卡在规格方面依旧没让大家失望,而且采用了16GB大显存,对于4K分辨率下的游戏玩家或者内容创作者,都是非常有利的。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    不过我们都知道在RTX 30系显卡中,RTX 3080发售价为5499元,RTX 3080 Ti的发售价为8899元。

    而此次NVIDIA GeForce RTX 4080的发售价为9499元起,所以根据价格来看RTX 4080对标的应该为上一代游戏旗舰RTX 3080 Ti。

    首先还是来看下外观,这次的GeForce RTX 4080从包装到产品基本与RTX 4090相同,一如既往的精美,看过之前首测的用户想必也已经大致了解。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    外包装依旧采用了哑光黑色硬纸盒,而且可以清楚地看到“GeForce RTX 4080”字体的变化,GeForce RTX的英文字样更圆滑,而数字则更“厚实”。

    从侧面可以看到,本次显卡的包装除了外圈的硬纸盒,内部全部采用了黑色瓦楞纸,除了更环保外,也增加了缓冲效果。在盒子两侧还有黑色胶带防止运输过程损坏。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    打开后的包装有点像帐篷形状,而如果买来收藏的话,显卡展示的角度也非常合适。有意思的是,显卡周围的装饰纹路自带“震惊”效果。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    不过这次相比RTX 4090不同的是,本次GeForce RTX 4080包装内附赠的是一根16pin转8pin*3的转接线。整卡功耗320W,推荐电源750W,当然有条件的玩家还是建议使用最新标准的ATX 3.0电源。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080 FE显卡的整体尺寸为304×137×61mm,占用3槽空间,这一点与RTX 4090完全相同。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080的整体设计依旧沿用了RTX 30系显卡的外观,但由于架构升级,发热量增大,散热自然也需要同步升级。

    本次的GeForce RTX 4080风扇尺寸再次增大,基本已经达到了显卡整体框架的直径,而在散热风扇增大的基础上,最大气流动态增加20%,同噪音等级的气流动态增加15%。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    视频输出接口上,依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR,对于目前阶段的产品来说完全够用。

    另外由于公版采用的双轴流散热系统,所以在视频输出接口部位能够看到大量的散热鳍片,这一点与上一代相同。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    本次GeForce RTX 4080的整卡功耗为320W,采用单16pin的辅助供电。目前已有部分电源厂商发布了最新的ATX 3.0标准高端电源,自带12VHPWR的16pin供电接口,最高可支持600W供电。所以不出意外的话,或许下一代显卡也将采用这样的单16pin来供电。

    需要注意的是,目前适用于RTX 30系列的12pin接口和电源转接器与RTX 40系列显卡不兼容。

    另外在RTX 40系显卡中,即便是首发的旗舰GeForce RTX 4090也不支持NVLink,所以想要重现往日的四路泰坦是不可能了。

    本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了恐怖的760亿晶体管,而在RTX 30系显卡中为280亿个。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。

    本次发布的GeForce RTX 4080达到49-TFLOPS,而不久前发布的RTX 4090则为83-TFLOPs,相比上一代NVIDIA Ampere则只有40-TFOPs,提升还是非常大的。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    完整AD102核心

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    完整AD103核心

    完整的AD103共有7个GPC(其中1个包含4组TPC);40个TPC、80个SM单元。从AD102和AD103两个完整芯片来看,中间的差距还是不小的。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    本次NVIDIA GeForce RTX 4080使用了削减后的AD103芯片,可以看到相比完整的总GPC没变,但少了2组TPC,并且NVENC单元也从6个削减到3个。

    其中不难看出完整的AD103核心日后必有他用,或许RTX 4080 Ti将采用满血版的配置。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    其实根据完整的架构图就能看出,此次Ada架构整体结构性的改动并不大,这一点从SM单元便能清晰印证,同样的FP32 CUDA核心,同样的FP32/INT32混合CUDA核心,同样的L1级缓存等等。当然,每个SM单元内部的Tensor Core升级为第四代。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    不过变化最为显著的,则是第三代光追核心,我们结合两代架构来看。在第二代光追核心中,包含负责边界交叉测试的Box Intersection Engine引擎,和负责三角形交叉测试的Triangle Intersection Engine引擎。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    而在第三代光追核心中,还增加了两个新的引擎:Opacity Micro-Map Engines(OMM)Displaced Micro-Mesh Engines(DMM),这两个新的硬件单元可以极大地提升光追性能(具体原理后文详细介绍)。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    至此,每2个SM单元组成一个TPC单元,每6组TPC单元组成一个完整的GPC顶层单元(在部分核心中,会出现5组TPC组成一个GPC单元的情况)。

    而每个GPC单元又搭载一个独立的光栅引擎、两组ROP分区(每组包含8个ROP单元)。

    由于整体架构分析篇幅较长,关于NVIDIA Ada架构的其他新特性就不在这里介绍了,将在文章末尾以附录的形式展开说明,有兴趣的用户可翻至最后。

    首先介绍一下测试平台,为了保障NVIDIA GeForce RTX 4090这张怪兽的性能发挥,我们的平台也再次进行了全面更新。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    本次测试平台的处理器采用了Intel最新的13代i9-13900K,性能绝对强悍,并且电源和显示器上进行了着重升级。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    本次因为性能大幅升级,且DLSS 3的加入,所以真正的4K时代已经来了。我们选择了爱攻&保时捷(Porsche Design)联合设计的PD32M。设计理念这里不再多讲,但这款显示器的性能也着实强悍。

    首先配备了4K/144Hz的硬性指标,并且采用MiniLED背光技术,支持1600尼特峰值亮度,8000万:1动态对比度,通过HDR1400认证。

    10.7亿显示色数, 97% DCI-P3、99%AdobeRGB覆盖率,色彩精准度ΔE<2(平均值),色彩呈现更加精准、丰富。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    本次固态硬盘我们选择了致态TiPlus7100,借助晶栈Xtacking 3.0架构闪存颗粒的强大优势,高达2400MT/s的闪存接口带宽为TiPlus7100带来高达7000MB/s和6000MB/s的最高读写速度,使性能达到了高阶PCIe4.0的水准,加上较高的TBW和5年硬核质保,是用户组建最新平台的优秀选择。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    首先看一下GPU-Z的参数,NVIDIA GeForce RTX 4080采用AD103核心,不过目前还没有识别到。

    拥有9728个CUDA,相比RTX 3080 Ti的10240少5%,不过不同架构下仅用数量来说并不准确,如果数量少性能反而提升,那证明NVIDIA Ada Lovelace的确带来了相当大的优势。Boost频率为2505MHz,而RTX 3080 Ti则为1670MHz,提升非常大。

    采用16GB GDDR6X Micron显存,位宽为2560bit,显存带宽达到了716.8 GB/s,光栅单元和纹理单元为112和304。

    下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    这里着重说明一下,i9-13900K在测试3DMARK FS成绩中存在BUG,GPU占用不足,导致分数较低;这里的FS成绩为i9-13900K处理器关闭小核心测试所得。

    在针对显卡DX11性能的3DMARKFS套装测试中,GeForce RTX 4080主要对比上一代RTX 3080 Ti,其中FS提升了46%;FSE提升了44%;FSU提升了41%,综合来看相比RTX 3080 Ti的性能提升约为44%

    而对比刚刚发布的老大哥RTX 4090,综合成绩相差24%左右,这中间足够安放一张Ti级别的显卡。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,GeForce RTX 4080相较RTX 3080 Ti的提升分别为:TS提升49%;TSE提升44%,综合下来约为47%。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    PortRoyal是3DMARK中专门针对光追性能的测试项,GeForce RTX 4080相较RTX 3080 Ti的提升约为41%

    综合来看,GeForce RTX 4080的理论性能相较GeForce RTX 3080 Ti的提升约为44%

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    Speed Way测试是3DMARK最新更新的用于测试DirectX12 Ultimate 性能的显卡基准测试。要运行此测试,显卡必须支持 DirectX 12 Ultimate 并包含 6GB 及以上显存。

    这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。并且有意思的是,Speed Way测试支持自由探索场景,可查看光照及摄像机设置的改变如何影响视觉效果。

    在该项测试中,我们对比了刚刚发布的RTX 4090显卡,从1080p分辨率到8K的差距依次为:28%/28%/30%/33%,可以看到在越高的分辨率下RTX 4090大显存的优势越明显,尤其8K分辨率。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    另外我们使用3DMARK刚刚更新的DLSS 3进行了相关性能测试。

    由于该项测试类别较多,仅展示GeForce RTX 4080显卡自身成绩,其实可以看到在DLSS 3的加持下,分辨率越高提升越明显,尤其在8K分辨率,是从无法运行到流畅的标准。

    由于本次RTX 40系加入了DLSS 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    首先在《地平线5》中,可以明显看到,虽然我们使用了i9-13900K处理器,但在1080p分辨率下依然能感受到帧数瓶颈。

    性能方面,GeForce RTX 4080相比GeForce RTX 3080 Ti的提升分别为:1080p提升47%;2K提升63%;4K提升60%,综合提升57%

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在《刺客信条:英灵殿》中,GeForce RTX 4080相比GeForce RTX 3080 Ti的提升分别为:1080p提升73%;2K提升73%;4K提升50%,综合提升65%

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在《无主之地3》中,GeForce RTX 4080相比GeForce RTX 3080 Ti的提升分别为:1080p提升55%;2K提升38%;4K提升26%,综合提升40%

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。所以测试帧数相对较低,但实际游戏配置相当亲民。

    性能方面,GeForce RTX 4080相比GeForce RTX 3080 Ti的提升分别为:1080p提升42%;2K提升42%;4K提升41%,综合提升42%

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

    在《边境》中,GeForce RTX 4080相比GeForce RTX 3080 Ti的提升分别为:1080p提升44%;2K提升51%;4K提升46%,综合提升47%

    由于本次新技术DLSS 3的推出,将有35款游戏将于近期推出全新的DLSS 3功能,本次我们也拿到了部分游戏的测试版。

    其中11月15日已有10款加入DLSS 3的游戏,包括《逆水寒》、《微软模拟飞行》、《毁灭全人类2:重新探测》、《瘟疫传说:安魂曲》、《光明记忆:无限》、《暗影火炬城》、《F1 22》、《生死轮回》、《漫威蜘蛛侠:重制版》、《超级人类》。

    下面就让我们来实际测试,拥有全新的DLSS 3的游戏,能达到何种帧率。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    本次DLSS 3的测试图表比较繁琐,并且增加了1% Low FPS和延迟的测试,普通的FPS好理解,那么这个1% Low FPS是什么意思。

    首先,游戏benchmark通常测试的FPS即为,一段时间内的游戏平均帧。而1% Low FPS则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。

    其实简单来说,这两个数值都不能代表我们在游玩时,具体哪一刻的感受,但FPS更注重整体,而1% Low FPS则是从最差的里面求平均,更谨慎一些。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    看懂了1% Low FPS,我们再来看这张图表,在坐标轴左侧的为延迟(越低越好),坐标轴右侧的均为帧数(越高越好),并且由于牵扯到正负坐标,所以两侧的值有可能会不同。

    由于目前测试DLSS 3的游戏均为测试版,所以难免出现BUG。

    在《微软模拟飞行》中,对于处理器的要求异常高,所以导致了上一次RTX 4090的测试,DLSS关和DLSS 2的分数几乎无变化的情况,这是由于DLSS 2依然会受制于CPU性能。

    而本次我们使用了旗舰级的13900k可以明显感受到性能的强大,在4K分辨率下关闭DLSS不会出现与DLSS 2分数相同的情况。

    而在DLSS 3中,我们能够明显看到帧数再次大幅提升,要知道我们所有DLSS 3的测试均在4K分辨率下进行。看来利用帧生成来突破CPU瓶颈限制,实际表现确实如宣传的那样神奇。

    不过帧生成并不是毫无弊端,这也是为什么此次测试加入了延迟。并且在开启DLSS 3后,NVIDIA Reflex是捆绑开启的。单相对于DLSS 2增加的这点延迟,在实际体验中的感受并不强。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    《幻塔》是本次新增的DLSS 3测试,作为一款移动端和PC端多平台的游戏,在PC端中已经加入了光线追踪以及DLSS,并且相当耗费性能。

    我们使用GeForce RTX 4080在关闭DLSS后,预设最高画质仅有43帧,延迟也达到了101毫秒。不过在开启DLSS 2后有明显改善,而DLSS 3则让这款游戏在4K分辨率开启光追后达到了电竞级帧数。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在《赛博朋克2077》中的数据反映比较真实,可以看到在DLSS关的光线追踪最高的情况下,即便GeForce RTX 4080显卡也只有28帧,并且延迟达到了126.5毫秒。

    而在开启DLSS 3后,帧数为107,提升了282%。虽然相比DLSS 2的延迟高了13毫秒左右,但依然维持在较低的水平。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    《瘟疫传说:安魂曲》目前已经发布,相信不少玩家都感受到了其精美的画面,不过除了显卡需求较高,同屏30万只老鼠对于CPU的要求也异常高。

    不过由于DLSS 3的特性便是无视CPU BUNDLE,强行提高帧数。GeForce RTX 4080在DLSS 3和DLSS关之间的帧数提升达到了149%。可以看到虽然DLSS 3的延迟有所增加,但仍然比DLSS关闭后要低。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    目前《F1 22》的数据测试同样有问题,在DLSS关和DLSS 2中均没有延迟数据。这一组主要看帧数的提升。其中DLSS 3相比DLSS关的帧数提升了165%,DLSS 2的提升也达到了134%。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在国产游戏《逆水寒》的光追测试中,本次我们选择的测试demo采用了真正的全局光照。所以在我尝试关闭DLSS运行后,第一次电脑直接崩溃重启,第二次侥幸能够运行,帧数也仅有个位数,而延迟早已上万。

    所以关闭DLSS测试行不通,这组数据主要看开启DLSS后的帧数变化。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    《暗影火炬城》也是本次新增的DLSS 3测试,在开启光追后对于性能要求明显提高。其中DLSS 3相比DLSS关的帧数提升了122%,DLSS 2的提升则达到了110%。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    《毁灭全人类2》是一款开放世界“爽游”,玩家将扮演外星人入侵地球。在开启DLSS 3后不仅帧数相较关闭有87%的提升,1% Low的帧数提升更大,达到了123%。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在Unity的测试软件中,将会自动播放一段即时演算视频,我们通过FrameView记录全程。不过由于程序仅提供关闭和开启DLSS 3的操作,所以我们取两组分数。

    可以看到在关闭DLSS 3后不仅平均FPS只有23帧,延迟也高达189ms。而开启DLSS 3后提升非常大,性能提升达到了248%。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在UE5提供的测试游戏中,方便的给出了DLSS的快捷测试,这里分为DLSS关(超分辨率关+帧生成关+Reflex关);DLSS 2(超分辨率性能+帧生成关+Reflex开);DLSS 3(超分辨率性能+帧生成开+Reflex开)三档测试。

    另外,在DLSS关闭状态下,FrameView软件无法监测延迟。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    当然针对画质方面,我们也进行了测试,在上图中我们截取《赛博朋克2077》中的一角,可以看到在两种DLSS模式下,相较原画质几乎没有明显变化,只在栅栏处的光影效果有所不同,但对于如此大幅度的帧数提升,这点瑕疵几乎可以忽略不计。

    虽然本次评测显卡为80级别产品,但16GB的大显存对于内容创作者同样是有很大帮主。首先我们使用SPECviewperf 13这款工业、专业软件跑分测试。

    对比显卡为RTX 4090显卡以及上一代游戏旗舰RTX 3080 Ti显卡。

    SPECviewperf 13

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在SPECviewperf 13的软件测试中,可以看到部分软件对比上一代游戏旗舰RTX 3080 Ti的提升非常明显,其中3DS MAX的提升幅度达到81%。不过由于我们为1080p下的软件环境测试,RTX 4090在显存方面的优势并不明显。

    Blender

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    Blender是一款专业的三维渲染软件,本次推出了固定的benchmark跑分软件,省去了安装软件下载素材的麻烦。这款跑分软件只需下载好启动程序,软件会自动渲染测试monster/junkshop/classroom共三个场景。

    上图为GeForce RTX 4090显卡得分,分别为6504/2982/3034分,平均4173分;下图为GeForce RTX 4080显卡得分,分别为4845/2246/2316分,平均3136分。

    两张显卡的性能差距在33%左右,相比3DMARK的纯理论分数差距较大,毕竟90级显卡曾经是过去的TITAN,地位不容撼动。

    DaVinci_Resolve_18.0.2

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    下面我们通过达芬奇来对NVIDIA AV1编码进行实测,对比输出为H.264编码。输出尺寸为4K UHD,质量选择最好,来看看两组成品有何区别。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    由于我们没有固定码率,而选择了相同的画面质量,可以看到在同质量下,AV1所生成的视频码率更低,几乎为H.264的三分之一。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    而低码率也就意味着视频体积越小,该段视频采用AV1编码的大小为H.264编码的四分之一,对于硬盘的空间节省非常明显,下面再来看看两段视频的画质表现如何。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    我们选择NVIDIA的ICAT软件进行分屏对比,将这段4K视频放大500%后查看噪点情况。可以看到使用AV1编码远处角色的像素过度更平滑,几乎没有很明显的颗粒感,这波AV1完胜。

    当然AV1也不是没有遗憾,就是目前很多播放器还不支持AV1解码,泛用性没有那么高,但随着越来越多的产品支持AV1编码,相信流通起来还是很快的。

    功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    可以看到GeForce RTX 4080这张显卡对于温度的控制同样令人惊叹,看来改进的散热器效果显著。通过1小时左右的拷机测试,温度一直控制在64℃以下,热点温度也仅有74℃左右。

    游戏

    1080p

    1440p

    4K

    Control

    212 W

    288 W

    297 W

    Cyberpunk 2077

    224 W

    275 W

    287 W

    Forza Horizon 5

    172 W

    197 W

    238 W

    Guardians of the Galaxy

    177 W

    233 W

    266 W

    Metro Exodus

    205 W

    262 W

    295 W

    值得一提的是,本次我们在拷机测试中最大板载功耗为308W左右,TDP达到了96%。但在实际游戏测试中,大部分3A游戏能够在260W左右,一些非常耗费性能的3A游戏才能够到达290-300W左右,远低于额定功耗。

    所以在实际的使用过程中,由于不同游戏负载不同,GPU的实际功耗是动态变化的,类似于FPS随时间的变化,RTX 40系列很难触及功耗墙。

    如果说RTX 4090的发布是秀肌肉的产品,那么RTX 4080显卡的发布算是真正敲开了RTX 40系的大门,它的规格更贴合玩家所需,也会是真正纳入玩家眼中的一款游戏显卡。

    RTX 4080相较上一代游戏旗舰RTX 3080 Ti的理论综合提升约为44%,相应的对比RTX 3080提升约为55%左右,称得上包里,但对比之前发布的RTX 4090稍逊一筹。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    对于常规的3A游戏来说,RTX 4080能够在4K分辨率下体验到顺滑的百帧效果,虽然相比RTX 4090的电竞级有些差距,但对比上一代RTX 3080 Ti来说,提升了一大步的游戏体验。

    另外,目前80和90级别的两款显卡在性能上存在20%左右的差距,中间至少还可以安放一个RTX 4080 Ti。至于时间,可能要等到RTX 40系整体的价格稳定下来,在进行部署。

    说到价格,RTX 4080的建议售价为9499元起,或许是因为当年RTX 3080的定价实在太低,这一次着实令人意外。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    但说到底,一切商品都是根据市场供需关系来调整的,接近万元的售价能够负担得起的还是少数玩家,也只能交给时间来打磨了。

    不过RTX 40系最大的亮点在于DLSS 3的帧生成技术,它可以无视CPU瓶颈强行提升帧数,不过我们测试平台的13900k作为目前的旗舰处理器能碰到瓶颈确实不容易……但对于大部分玩家来说,CPU的更新换代相比于其他硬件更慢,相信目前正在使用9代10代处理器的依然大有人在,此时正式DLSS 3发挥作用的时候。

    GeForce RTX 4080将在11月16日正式发售,也就是明天。如果你有足够的预算,并想尝试最新黑科技DLSS 3以及3A游戏的4K电竞级帧率,不妨试试手气。

    Shader Execution Reordering (SER)着色器执行重排序

    SER主要的作用是提升着色器性能,它可以将效率低下的工作负载,动态重组为更高效的工作负载。主要针对光线追踪的性能提升非常大。

    简单地说,GPU在执行类似工作的时候效率最高。但随着光追效果越来越强大,每个场景可能有数百万条光线照射在不同材质上,而我们知道不同材质的反射率,以及反射效果也是不同的。所以这样就为着色器创建了大量的、发散的,效率低下的工作负载。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    SER则可以将这些杂乱的指令重新分门别类,动态重组为更高效的工作负载。根据NVIDIA的说法,SER可将着色器性能最多提升2倍,并将游戏帧率最高提升25%。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    举个简单的例子,当光线第一次从发射端到碰撞端是非常有规律的射线,而碰撞到物体后的二次光追,则会出现大量发散的、无规律的反射,这对于光追负载是非常高的。而从图中便能看到,SER可以将这些指令进行二次排序,以发挥出着色器的最大性能。

    不过好在这么实用的功能并不是RTX 40系的专利,它是一个易于集成的SDK,目前需要游戏开发商集成在游戏中。另外由于它是一个通用的逻辑,后续也有可能直接集成在Windows的API中,这样游戏开发者就无需特意引用,直接调用系统API即可。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    可以说SER对于手持RTX 20系及以上(能够开启光线追踪)的N卡用户来说,是极大地福音。毕竟免费提升的光追性能,谁不喜欢呢。

    第三代 RT Cores

    RT Core的作用在于更快的光线追踪计算能力,如果说在RTX 30系显卡中,想要畅享4K高帧率游戏有点吃力,那么RTX 40系显卡中,将显得轻而易举。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    在GeForce RTX 4090这张显卡上,达到了191 RT-TFLOPs的处理能力,而RTX 30系显卡最快处理能力为78 RT-TFLOPs,足足为2.4倍。并且根据NVIDIA的官方说法,第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍。而这只能说明,这张4090并非Ada Lovelace架构的最终形态。

    Opacity Micro-Map Engines

    在第三代RT Cores中引入了两个重要的硬件单元,首先是Opacity Micro-Map Engines,可以理解为微映射透明度引擎,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。

    比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    不过Opacity Micro-Map Engines可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担。

    Displaced Micro-Mesh Engines(DMM)

    Displaced Micro-Mesh Engines可理解为微网格置换引擎,它构建光线追踪的BVH(Bounding volume hierarchy)的速度提高了10倍!所使用的的显存减少了20倍!

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    DMM由第三代RT core本地处理,与前几代相比,它只使用基本三角形渲染复杂几何图形,极大减少了存储和处理需求。

    具体的工作原理从图中一目了然,新的DMM可以将面数非常多的复杂图形做简化,创造出简单的模型,但整体的光线追踪效果不变。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    通过一些模型数据我们可以具体看到,新的DMM将模型简化了多少。原本1100万三角面的模型,经过简化后,只有15万左右的微网格,BVH的构建速度提升了8.5倍,小了6.5倍。

    而这还不是最夸张的,越复杂的模型往往优化的效果越好,在官方展示的这几组对比示例中,最快可提升大于15倍的速度,容量简化20倍的模型。

    第四代 Tensor Cores

    除了光追单元的升级外,第四代张量核心的升级更加恐怖。它采用了新的FP8张量引擎,在GeForce RTX 4090这张显卡上,吞吐量达到了1.32 Tensor petaFLOPs,提高了5倍。

    注意这里的单位——petaFLOPs。以往的TFLOPs为万亿次浮点运算,而petaFLOPs则为千万亿次浮点运算。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    DLSS 3

    本次推出的DLSS 3也是RTX 40系一大卖点,从DLSS 2.3直接迈入了DLSS 3版本,也能看出此次的升级之大。而DLSS 3也被NVIDIA官方称为神经网络渲染新时代。

    全新的DLSS 3在原有的DLSS超分辨率的基础上,添加了光学多帧生成技术,以生成全新的帧,而不像原来只能生成像素。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    DLSS 3结合了DLSS超分辨率、DLSS帧生成和NVIDIA Reflex这三大技术,能够重建八分之七的像素,极大提高性能。

    在GPU受限的游戏中,比如2K分辨率及以上的更高分辨率,DLSS 2能够将帧率提高2倍,DLSS 3则能够提升4倍。

    本次DLSS 3跨越了一个大版本,从想法和原理上也再度升级,完全“猜想”1帧的技术,我们解释起来简单,但实施起来需要大量的推理与演算,以及绝对超前的想法。

    不过“凭空”生成的1帧,在延迟上绝对要比DLSS 2高。所以此次完整的DLSS 3中,捆绑了NVIDIA Reflex,可以有效帮助减小延迟。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    这也不负NVIDIA给它起了个“神经网络渲染新时代”的名号。纵观目前市面上的XeSS、FSR技术,DLSS绝对称得上“巨人的肩膀”。当然,连年的创新,苦的是手持上一代显卡的玩家,想体验DLSS 3的帧生成,目前唯一的办法就是购入一张RTX 40系显卡。

    New Optical Flow Accelerator

    New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的,这也是为何DLSS 3中的帧生成为RTX 40系显卡独享。

    光流加速器在原本DLSS 2的基础上,还可以计算两个连续帧内的光流场,能够捕捉游戏画面从第1帧到第2帧的方向和速度,从中捕捉粒子、反射和光照等像素信息。并分别计算运动矢量和光流来获得精准的阴影重建效果。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    以《赛博朋克2077》为例,在第一帧,光流加速器会捕捉到每一个像素中的粒子、反射和光照等信息。并在第二帧中查找匹配的像素区域,计算帧之间的差值。

    如果说原来DLSS 2能够“猜”出一张图剩下的像素,那么DLSS 3除了这些,还能够“猜”出下一帧的画面。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    另外由于DLSS 3的帧生成是在GPU中处理和运行的,所以即使遇到CPU瓶颈的游戏,AI同样能够提升帧率。这也是为什么在此次发布会中说到,DLSS 3能够突破CPU的限制来提升帧数。

    双AV1编码器

    本次升级的第八代NVENC编码器可以说是直播、视频、后期工作者的极大福音。它首次加入了对AV1编码的支持,最显而易见的效果就是直播。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    相比传统的H.264编码,AV1编码的效率平均提升了40%,在同码率下AV1编码的画质将更好。目前大部分直播的分辨率和清晰度,均受限于平台规定的最大比特率。以Twitch限制的8Mbps为例,可以看到在同等带宽下,同为2K 60帧的画面,采用AV1编码的清晰度明显比H.264更高。

    说起直播,OBS相信大家都不陌生,在10月份即将发布的补丁中,OBS就加入了对NVENC的AV1编码支持

    当然,直播只是我们更容易见到的AV1优势,在视频工作的所有环节,AV1编码都可以带来极大提升。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    所以,如图所见。NVIDIA已经为广大用户铺好了一条完整的生态链,从编码API、软件、平台到播放器,将全面支持AV1编码。

    另外再说一下NVIDIA一直强调的双AV1编码。顾名思义,即部分显卡内搭载了两个编码器,它所带来的效果也是显而易见的。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    首先,根据官方宣传的,在4K H.265的导出速度上,RTX 4090是RTX 3090 Ti的2.2倍;在8K H.265的导出速度上更是达到了2.5倍。这部分的提升,大家常用的剪映同样适用,感兴趣的用户不妨亲自体验一下。

    除了导出速度,8K 60帧的视频录制在以前简直难以想象,而双编码器的好处就是可以将图像一分为二,两个编码器分别处理7680×2160的图像信息,最后拼合完整。

    关于编码部分,可能大部分用户的感受不深,但当有一天,你想录屏的时候,却发现显卡不支持,才会发觉它的重要性……

    随着图像逐渐进入到超清时代,硬件编码和渲染几乎已经成为不可或缺的帮手。虽然论质量,硬件编码仍不及CPU软编,但软编做到了极限画质,也要承受时间的无穷长。甚至在一张8K渲染图中,两种编码方式的时间差距就已经达到了几个小时,遑论一段10秒的CG动画。在不断进步的硬件编码中,质量和时间也在不断地被挑战和刷新。

    Ada Lovelace(1815-1852)是英国数学家、计算机程序创始人,建立了循环和子程序概念,被称为世界上第一位程序员

    Ada从小对数学有极高天赋,其父称她为“平行四边形公主”,后来的合作伙伴Charles Babbage称她为“数字女巫”。在19岁时Ada嫁给了自己曾经的科学家庭教师,婚后的她对数学热情不减。

    NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代

    1842年到1843年花了9个月时间翻译了Babbage的《分析机概论》的备忘录,写了很多注记,其中给出了用计算机进行Bernoulli数求解的详细说明。由此,Ada被广泛认为是世界上第一个程序员。

    而以她名字命名的语言——ada语言,已经成为了美国军方开发战斗机等尖端武器的语言。

    从几行简短的生平简介中,不难看出Ada的生命虽然只经历了短暂的37个春秋,但却足以被后人铭记。

    这也是为什么此次NVIDIA RTX 40的先行宣传中,用到了“以未来敬传奇”的slogan。

    本文属于原创文章,如若转载,请注明来源:NVIDIA GeForce RTX 4080显卡首测 游戏旗舰大迭代https://diy.zol.com.cn/807/8071742.html

    diy.zol.com.cn true https://diy.zol.com.cn/807/8071742.html report 22145 不久前NVIDIA刚刚发布了RTX 40系旗舰显卡GeForce RTX 4090,其理论性能相比RTX 3090 Ti提升多达70%左右,时隔一个月,今天我们为大家带来了NVIDIA GeForce RTX 4080 16GB显卡的首发评测。其实“90”级别产品在NVIDIA早几代的型号中,属于TITAN级别,其超大显存是标志性差...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    • 第1页:NVIDIA RTX 4080显卡首测
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • DIY组装电脑
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错