热点:

    次世代大作标配 光线追踪DLSS深度剖析

      [  中关村在线 原创  ]   作者:曲楠   |  责编:郎孟华

    随着RTX 30系显卡的发布,人们在关心性能的同时,一些软性技术的应用和更新更受到玩家的青睐,如游戏中的光追表现和DLSS效果。这两种技术可以说有着划时代意义,光线追踪可以让我们在游戏中获得更为真实的光线效果,让游戏画面不断趋近于真实,同时还可以节省大量游戏开发者的时间,而DLSS效果则可以在不降低画质的情况下让帧数暴涨。

    零死角散热 我有我信仰 技嘉AORUS GeForce RTX™ 3080 XTREME 10G评测
    技嘉AORUS GeForce RTX 3080 XTREME 10G显卡

    在新的GeForce RTX 30系显卡中,NVIDIA更新了RT Core和Tensor Core,并且新增了大量支持这两项技术的游戏,今天笔者简单为大家简单说明并进行几款游戏的实测展示。

    次世代大作标配 光线追踪DLSS深度剖析

    首先介绍一下测试平台,为了能完全发挥技嘉AORUS RTX 3080 XTREME 10G显卡的性能,我们选择了目前桌面旗舰级CPU和主板i9-10900k和Z490主板。

    01 RT Core及光线追踪详解

    NVIDIA2080/2080Ti评测 12年等来了什么
    光线追踪的演变经历了约半个世纪

    其实,光线追踪的概念在很早就已经被人所提出了。光线追踪技术其实就是将光源产生的光线所产生的折射,反射等光线变化和对阴影产生的反应通过计算准确的反映到画面之中,为人们带来百分之百的光影效果。

    双倍加量不加价 NVIDIA RTX 3080显卡首测
    光追工作原理示意

    在此次的NVIDIA Ampere架构中,NVIDIA官方宣布为第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,着色器发出光线追踪的请求,交给RT Core来处理,它将进行两种测试,分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing)。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。

    相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,同时新的架构翻倍了光线与三角形的相交吞吐量,RT Core达到58 RT TFLOPS,而Turing为34 RT TFLOPS。

    而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。

    双倍加量不加价 NVIDIA RTX 3080显卡首测
    RT Core的变化

    在Turing的RT Core中,可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。

    02 《轩辕剑7》光线追踪演示

    关于概念性的东西我们就说这么多,相信玩家更想看到的还是光追的实际效果,首先我们来测试一下近期上线的国产游戏《轩辕剑7》。

    技嘉光追选题

    技嘉光追选题
    《轩辕剑7》RTX开关对比(点击图片查看大图)

    在《轩辕剑7》中,我们以序章的街道场景来做对比,第一张图为打开光追后的效果,光线追踪的效果显而易见。打开光追后街道的灯光、阴影以及太阳光在水面的反射都有很大改善,而游戏整体的色调也由冷变暖,更富有生活气息。

    技嘉光追选题

    技嘉光追选题
    《轩辕剑7》RTX开关对比(点击图片查看大图)

    第二组对比我们选择了太史府门前,通过对比不难发现,打开光追后的效果影响了游戏整体的气氛,第一张的灯光氛围营造出了回家温馨的感觉,而第二张画面阴暗感觉马上会有什么不好的事发生,虽然比较符合游戏背景,但整体观感略差。

    03 Tensor Core及DLSS详解

    我们都知道光线追踪在游戏内会耗费巨大的计算资源,这也导致了它在20系显卡中由于算力的因素,玩家反响并不大。而在全新的NVIDIA Ampere架构中不但引入了第二代RT Core,还有第三代Tensor Core。

    NVIDIA自Volta架构开始,在GPU中增加了针对深度学习加速设计的矩阵运算单元,并称之为Tensor Core(张量计算核心)。

    双倍加量不加价 NVIDIA RTX 3080显卡首测
    稀疏深度学习

    在图灵架构里,NVIDIA引入了第二代Tensor Core,而到了RTX 30系列所采用的Ampere架构,则进化到了第三代Tensor Core。在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。

    首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。

    在实际应用中,深度学习技术在图形图像各个领域都有着价值巨大的应用,而在游戏体验中则是被称为深度学习超采样的DLSS技术。最新一代的DLSS能够使得游戏画质极大提升,细节和锐度媲美、甚至超越原生分辨率。

    双倍加量不加价 NVIDIA RTX 3080显卡首测
    第三代Tensor Core的处理能力大大提升

    DLSS本质是一种图像重建算法,其加原理其实也很简单。开启DLSS后,游戏引擎中的诸如动态光源、阴影的计算,封闭空间环境遮挡(SSAO)、屏幕空间反射(SSR),甚至实时光线追踪。都会被降低到1/2甚至1/4像素的低分辨率下运行,GPU的负担大幅度减轻。渲染得出的最终场景会通过Tensor Core结合DLSS进行高分辨率重建,从而用较低的GPU负载获得流畅且画质极佳的游戏体验效果。

    04 《堡垒之夜》、《死亡搁浅》DLSS效果展示

    下面我们来通过实测看一下不同游戏中开启DLSS后的效果,我们选择了《堡垒之夜》和《死亡搁浅》进行测试。

    技嘉光追选题
    《堡垒之夜》DLSS开关对比(点击图片查看大图)

    首先来看《堡垒之夜》的对比画面,其实在游戏中DLSS的开关几乎不会影像画面,但是带来帧数的变化却非常明显。第一组对比由于天色的变化略失精准,但打开DLSS质量模式后,角色衣服的褶皱及棱角更明显。在帧数上DLSS关为78帧,DLSS质量为115帧,帧数提升47%。

    技嘉光追选题
    《堡垒之夜》性能/极致性能对比(点击图片查看大图)

    第二组对比为DLSS性能与DLSS极致性能,两者从画面上几乎看不出区别,但是帧数仍然提升非常恐怖。相较于关闭DLSS的帧数,DLSS性能为129帧,提升65%;DLSS极致性能为145帧,提升85%。145帧的成绩已经完全达到高刷新电竞显示器的帧率要求,同时在游戏中也能更顺畅,最主要的是画质没有任何降低。

    技嘉光追选题
    《死亡搁浅》DLSS开关对比(点击图片查看大图)

    下面我们来看小岛先生的最新游戏《死亡搁浅》,这款游戏有个特别的设计就是自带锐化,从图中我们也能看到,在一些细小部位,锐化的痕迹十分明显。在关闭DLSS的情况帧数为118,而打开DLSS质量模式后帧数为145,画面经过AI处理,消除了很多锯齿。帧数方面,打开DLSS质量模式后,提升为22%。

    技嘉光追选题
    性能/极致性能对比(点击图片查看大图)

    在选择DLSS性能和DLSS极致性能后,帧数为150帧和163帧。同样画面相较原生画质来说将锐化效果进一步消除,观感更柔和。与原生画面的帧数相比,提升分别为27%和38%。

    其实和光追相比,我认为DLSS对于玩家来说更是终极梦想,在画质不变甚至更好的情况下极大提升游戏帧数,这意味着你可以花费更少的价格体验到更高端显卡的性能,同时如果你的显卡性能够强劲帧数比较富裕,还可以再开启光追效果,进一步增加沉浸感。

    05 技嘉AORUS RTX 3080 XTREME 10G显卡

    本次的测试所使用的是技嘉AORUS RTX 3080 XTREME 10G显卡,作为玩家口中的“大雕”,性能自然足够出众。

    零死角散热 我有我信仰 技嘉AORUS GeForce RTX™ 3080 XTREME 10G评测
    AORUS GeForce RTX 3080 XTREME

    在外观上这款显卡正面采用2个115mm和1个100mm风扇,搭配着内部风爪静叶、进气格栅散热设计和正逆转风扇,让风压可以完整地覆盖到所有散热鳍片,从而实现显卡内部散热零死角。

    零死角散热 我有我信仰 技嘉AORUS GeForce RTX™ 3080 XTREME 10G评测
    三风扇叠加设计

    与我们往常见到的风扇转动方向有所不同,这款显卡采用正逆转风扇,正逆转气流导向设计,可显著减少相邻风扇之间的乱流并提高气流压力。同时从图中我们也能看到三个风扇相互交错叠加,真正实现了零死角的难题。

    零死角散热 我有我信仰 技嘉AORUS GeForce RTX™ 3080 XTREME 10G评测
    技嘉AORUS RTX 3080 XTREME 10G视频输出接口

    另外在显卡视频接口方面,有2个HDMI 2.1+1个HDMI 2.0+3个DP的设计,总计惊人的6接口,让AORUS RTX 3080 XTREME 10G显卡拥有着更强大的扩展性。

    在性能方面,AORUS GeForce RTX 3080 XTREME突出特性便是核心频率达到恐怖的1905MHz,其他主要参数,采用了GA102核心,三星8nm工艺,芯片面积达到了628平方毫米,拥有8704个CUDA,采用10GB GDDR6X显存,位宽为320bit,显存带宽达到了760.3GB/s,光栅单元和纹理单元分别为96和272。

    零死角散热 我有我信仰 技嘉AORUS GeForce RTX™ 3080 XTREME 10G评测
    金属造型的强化背板

    技嘉AORUS GeForce RTX 3080 XTREME对于目前大部分3A大作在4K分辨率下都能轻松应对,即使是号称众生平等的《刺客信条:奥德赛》也能在4K分辨率下跑到60帧以上,对于即将上市的《赛博朋克2077》来说,灯红酒绿的不夜城必然也需要性能更强劲的显卡来体验赛博朋克的魅力。如果对于近期发售的大作比较感兴趣,不妨关注一下这款技嘉AORUS GeForce RTX 3080 XTREME显卡。

    本文属于原创文章,如若转载,请注明来源:次世代大作标配 光线追踪DLSS深度剖析//diy.zol.com.cn/756/7567556.html

    diy.zol.com.cn true //diy.zol.com.cn/756/7567556.html report 6584 随着RTX 30系显卡的发布,人们在关心性能的同时,一些软性技术的应用和更新更受到玩家的青睐,如游戏中的光追表现和DLSS效果。这两种技术可以说有着划时代意义,光线追踪可以让我们在游戏中获得更为真实的光线效果,让游戏画面不断趋近于真实,同时还可以节省大量游戏开...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    • 第1页:光线追踪DLSS深度剖析
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • DIY组装电脑
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错