热点:

    NVIDIA2080/2080Ti评测 12年等来了什么

      [  中关村在线 原创  ]   作者:李健   |  责编:李诺

    ● TENSOR CORE和DLSS

      其实TENSOR CORE对于我们来说并不陌生,其最早出现在Volta架构中,Turing架构在浮点精度上对其作了大量的优化工作来保证计算的准确性。

    NVIDIA2080/2080Ti评测 12年等来了什么
    Turing TENSOR CORE计算维度

      Tensor在中文里面的意思就是张量,区别于我们常见的标量(0维)、矢量(1维)、矩阵(2维),张量拥有3维或者更高维,本质核心上就是一个数据容器,可以包含更多维度数据。其主要应用就是目前大火的AI——深度学习,这里面主要会用到FMA矩阵融合计算,而TENSOR CORE的工作方式天生就适用于这种计算。

    NVIDIA2080/2080Ti评测 12年等来了什么
    TENSOR CORE是一个数列的运算方式

      它可以对两个4×4 FP16浮点矩阵进行相乘操作,然后将结果加入到另一个4×4 FP16/FP32浮点矩阵中,最终输出新的4×4 FP16/FP32矩阵,NVIDIA将Tensor Core进行的这种运算称为混合精度数学,因为输入矩阵的精度为半精度,但乘积可以达到完全精度。

      每个时钟周期内,图灵架构的Tensor核心可以执行64个FMA运算,从而大大加速矩阵运算,除了新的神经图形功能外,还用于深度学习训练和推理操作。

    NVIDIA2080/2080Ti评测 12年等来了什么
    NGX

      而在加入TENSOR CORE之后,NVIDIA还为其配置了一个全新的神经图形框架:Neural Graphics Framework,简称NGX,其可以在游戏中实现诸如DLSS深度学习超采样抗锯齿、AI Super Rez超级分辨率、AI Slow-Mo慢动作、AI InPainting等等。

      我们先来说说DLSS深度学习超采样抗锯齿。来详细的了解一下抗锯齿的原理并拿最早的SSAA抗锯齿进行举例。

      由于高分辨率下的来源信号或连续的模拟信号能够存储较多的数据,但在通过取样(sampling)时将较多的数据以较少的数据点代替,部分的数据被忽略造成取样结果有损,使机器把取样后的数字信号转换为人类可辨别的模拟信号时造成彼此交叠且有损,在声音中,便会出现刺耳、不和谐的音调或是噪音。同样,在3D绘图时,每个图形由像素组成,每段瞬间画面由帧组成,因为屏幕上的像素有限,如果要表现出多边形的位置时,因技术所限,使用绝对坐标定位法是无法做到的,只能使用在近似位置采样来进行相对定位。由于没有足够的采样来表现出3D世界中的所有物品的图形,所以在最后图像显示上,这些现象便会造成在物品与物品中过渡的边缘就会产生波浪状、圆形、锯齿和闪烁等有损现象,严重影响了画面的质量。

    NVIDIA2080/2080Ti评测 12年等来了什么
    如果没有抗锯齿......

      超级采样抗锯齿(Super-Sampling Anti-aliasing,简称SSAA)是早期抗锯齿方法,比较消耗资源,但简单直接,先把图像映射到缓存并把它放大,再用超级采样把放大后的图像像素进行采样,一般选取2个或4个邻近像素,把这些采样混合起来后,生成的最终像素,令每个像素拥有邻近像素的特征,像素与像素之间的过渡色彩,就变得近似,令图形的边缘色彩过渡趋于平滑。再把最终像素还原回原来大小的图像,并保存到帧缓存也就是显存中,替代原图像存储起来,最后输出到显示器,显示出一帧画面。这样就等于把一幅模糊的大图,通过细腻化后再缩小成清晰的小图。如果每帧都进行抗锯齿处理,游戏或视频中的所有画面都带有抗锯齿效果。而将图像映射到缓存并把它放大时,放大的倍数被用于分别抗锯齿的效果。

    NVIDIA2080/2080Ti评测 12年等来了什么
    DLSS工作原理

      但是无论是哪种抗锯齿,玩家们都是在不影响画面美观度的基础上尽量开到最低,因为这玩意太耗费显卡的性能了。但是这一代的DLSS深度学习超采样抗锯齿却完全不会这样,简单的来说,NVIDIA会通过收集数千个以64×超级采样生成参考画面,经过对像素点进行64次偏移着色合成输出后,理论上画面细节具有近乎完美的图像效果。同时还会生成正常的渲染图像,然后要求DLSS网络响应输出对应结果,观察与64×超级采样画面差异,调整网络权重,经过多次迭代以后,DLSS自行学习产生的结果将具有与64×超级采样画面相同质量的细节,还可以避免TAA产生的运动模糊等问题。

    NVIDIA2080/2080Ti评测 12年等来了什么
    传统TAA和DLSS 2×的细节对比

    NVIDIA2080/2080Ti评测 12年等来了什么
    DLSS 2×相当于64×的超采样抗锯齿

      而这一切的运算过程都是在NVIDIA的超算上进行的,不会消耗玩家的资源,NVIDIA会将每一次更新的结果放在显卡驱动中,玩家们只要通过驱动的更新就可以享受到针对自己显卡型号的最佳抗锯齿。

    NVIDIA2080/2080Ti评测 12年等来了什么
    后续首发带有DLSS的游戏

      而在官方的PPT中,也提到了确定加入DLSS支持的15款游戏,并且这个数字还在不断的扩大中。值得一提的是,这其中有5款游戏同时支持RTX光线追踪和DLSS抗锯齿技术,分别是《原子之心》、《逆水寒》、《剑网3》、《机甲战士5:雇佣兵》、《古墓丽影:暗影》。

    本文属于原创文章,如若转载,请注明来源:NVIDIA2080/2080Ti评测 12年等来了什么//diy.zol.com.cn/699/6995931.html

    diy.zol.com.cn true //diy.zol.com.cn/699/6995931.html report 3522 ● TENSOR CORE和DLSS  其实TENSOR CORE对于我们来说并不陌生,其最早出现在Volta架构中,Turing架构在浮点精度上对其作了大量的优化工作来保证计算的准确性。Turing TENSOR CORE计算维度  Tensor在中文里面的意思就是张量,区别于我们常见的标量(0维)、矢量...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • DIY组装电脑
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错