热点:

    NVIDIA GeForce RTX 3060评测 12G显存的全能卡

      [  中关村在线 原创  ]   作者:曲楠   |  责编:赵悟省

    NVIDIA RTX 30系显卡发布会已经过去了半年时间,在此期间NVIDIA先后发布了GeForce RTX 3080/3090/3070/3060 Ti系列GPU。现在定位入门级的产品GeForce RTX 3060也终于发布,完成了从顶级旗舰到入门级的全线布局,可以说近半年来NVIDIA风头无两。

    全新的RTX 30系GPU再次实现了GTX 10系叫好又叫座的情况,但随之而来的问题却相当明显,全球无货可卖。

    NVIDIA GeForce RTX 3060评测 12G显存的全能卡

    这其中包含很多因素,挖矿、产能不足、用户热情高涨等等,后两种情况是我们无法左右的,但挖矿囤卡对于普通用户来讲却非常痛恨,大量的矿老板从渠道源头把住显卡,导致用户从电商零售能买到的寥寥无几。

    从另一方面来讲,矿卡也一直是官方和民间非常忌讳的话题,目前如此大量的矿主囤积显卡,这也将导致“矿难”时会有大量显卡再次通过二手市场流向用户,而用户也无法通过常理或者技术手段来鉴别矿卡。

    但好在NVIDIA官方及时出手,2月18日官方发布了一则新闻,表示会降低GeForce RTX 3060 GPU的哈希率以降低加密货币从业者的吸引力,同时推出NVIDIA CMP专业矿卡。目前还不知道NVIDIA是否会将这一调整覆盖全线GPU,但及时出手对于普通用户来说总是好的。而供货方面,NVIDIA想必会调配一部分产能去服务CPM GPU,所以这一举措能否缓解全球的供货紧张我们还不得而知。

    NVIDIA GeForce RTX 3060评测 12G显存的全能卡
    iGame GeForce RTX 3060 Ultra W 12G

    回到我们今天的主题,由于GeForce RTX 3060没有公版发布,所以我们使用iGame GeForce RTX 3060 Ultra W 12G这张显卡进行测试,该显卡核心频率为1777MHz,与公版参数相同。首先我们来看全新的GeForce RTX 3060与上一代的GeForce RTX 2060主要区别在哪。

    01 NVIDIA Ampere架构下的RTX 3060

    iGame RTX 3060 Ultra W OC首测
    第一代NVIDIA RTX架构 Turing下的RTX 2060

    iGame RTX 3060 Ultra W OC首测
    第二代NVIDIA RTX架构 Ampere下的RTX 3060

    相较于上一代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3060中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060的着色器性能达到12.7 TFLOPS单精度性能,而Turing为6.5 TFLOPS。

    NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到24.9 RT TFLOPS,而Turing为19.5 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。

    例如最新发布的《赛博朋克2077》中,当玩家在游戏中遭遇赛车,追逐,打斗等激烈运动场景,第二代光追在架构上可以确保显卡渲染帧率相对更平稳,游戏体验上不会有频繁掉帧带来的顿挫感。

    索泰3060ti评测
    《赛博朋克2077》

    全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达102 Tensor TFLOPS,而Turing为51.6 Tensor TFLOPS。

    此次RTX 3060的全面升级在性能上相比RTX 2060综合提升20-25%,并且价格不变。目前在steam的硬件调查中,GTX 1060仍然以10%左右的占有率高居榜首,而RTX 3060相比GTX 1060拥有2倍于它的光栅性能,10倍的光线追踪性能,相信在这款显卡推出后势必也会让大量玩家考虑更换掉自己手中的GTX 1060,当然前提是产能跟上。

    02 全新的GA106核心

    此次发布的GeForce RTX 3060采用了全新的GA106核心,而之前的GeForce RTX 3060 Ti则用的GA104核心,与GeForce RTX 3070相同,下面我们也来看看GA106有哪些改动。

    NVIDIA GeForce RTX 3060评测
    完整的GA106核心

    完整的GA106 GPU包含3个GPC(图形处理集群)15个TPC(纹理处理集群)以及30个SM(流处理器)组成,GPC是占据主导地位的高级模块,拥有所有的关键图形处理单元,每个GPC包含一个专用光栅引擎。在新的NVIDIA Ampere架构中,每个GPC还包含了两个ROP分区,每个分区包含8个ROP单元。

    NVIDIA GeForce RTX 3060评测
    完整的GA102核心

    而完整的GA102核心包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,这里可以看到完整的GA102每个GPC中包含6个TPC,相比GA106要多出一组。目前只有GeForce RTX 3090使用了近乎完整的GA102核心,大家可以简单看一下两款核心之间的差距。

    NVIDIA RTX 3070首测 比肩RTX 2080Ti

    GeForce RTX 3060采用GA106核心拥有280亿个晶体管,628平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。

    本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。

    而通常我们计算显卡的CUDA数量,只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。

    GeForce RTX 3060共有3584个CUDA,其实它有1292个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了3584的CUDA数量。

    而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。

    与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。

    虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。

    双倍加量不加价 NVIDIA RTX 3080显卡首测
    传统的数据交换

    在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。

    双倍加量不加价 NVIDIA RTX 3080显卡首测
    RTX IO可以极大解放CPU负担

    当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。

    同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。

    03 3DMARK 理论性能测试

    首先介绍一下测试平台,为了保证此次评测能够发挥GeForce RTX 3060显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。

    NVIDIA GeForce RTX 3060评测

    在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

    NVIDIA GeForce RTX 3060评测
    GPU-Z参数

    首先看一下GPU-Z的参数,GeForce RTX 3060采用GA106核心,三星8nm工艺,芯片面积276平方毫米,拥有3584个CUDA,iGame GeForce RTX 3060 Ultra W采用了与公版相同的1777MHz频率。采用12GB GDDR6显存,位宽为192bit,显存带宽达到了360 GB/s,光栅单元和纹理单元为48和112。

    下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

    NVIDIA GeForce RTX 3060评测
    3D MARK FS套装测试

    在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的8张显卡进行分值对比,以便能更好的反应GeForce RTX 3060的性能水平,分数有些多比较乱,本次的主角笔者用发光标记显示。

    可以看到GeForce RTX 3060的性能对位RTX 2070,比之稍弱,但幅度相差不超过2%。另外由于采用GA106芯片,相比采用GA104芯片的RTX 3060 Ti还是相差不少的,在30-40%之间。而作为绝对实力的体现,GeForce RTX 3080的分数是GeForce RTX 3060的2倍,不过价格也同样是2倍。

    NVIDIA GeForce RTX 3060评测
    3D MARK TS套装测试

    而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,GeForce RTX 3060的分数与GeForce RTX 2070的分数差距缩小,几乎持平。而作为同后缀型号产品GeForce RTX 2060的分数差距在17-20%之间。

    NVIDIA GeForce RTX 3060评测
    3D MARK 光追测试

    PortRoyal是3DMARK中专门针对光追性能的测试项,通过这组光追性能对比图不难发现GeForce RTX 20系列的显卡性能呈较规则的递增形式,而在GeForce RTX 30系显卡中,GeForce RTX 3080的性能有非常大的提升,与GeForce RTX 3070相比有40%的提升。而GeForce RTX 3060 Ti与GeForce RTX 3070之间的差距与GeForce RTX 20系提升幅度比较吻合。

    04 游戏性能测试

    在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件

    另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。

    NVIDIA GeForce RTX 3060评测
    《刺客信条:英灵殿》游戏测试

    首先是刚刚推出的新游戏《刺客信条:英灵殿》,在实测中我们发现虽然理论成绩测试RTX 2070要强上一些,但实际到游戏中的分数基本与GeForce RTX 3060相吻合,相差不过1帧。而采用NVIDIA Ampere架构的GeForce RTX 3060与GeForce RTX 2060分数差距在25-30%之间。

    NVIDIA GeForce RTX 3060评测
    《德军总部新血脉》游戏测试

    《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在几个月前的跑分要高出现在平均30帧左右。

    NVIDIA GeForce RTX 3060评测
    《孤岛惊魂5》游戏测试

    《孤岛惊魂5》同样算是优化比较到位的3A大作,GeForce RTX 3060作为GeForce RTX 30系的入门级显卡,在2K分辨率下也能做到63帧的流畅运行,性能十分强悍。

    NVIDIA GeForce RTX 3060评测
    《光明记忆:无限》游戏测试

    《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。由于这个演示demo涵盖了大量光追元素,大部分显卡的跑分成绩都偏低,即便是GeForce RTX 3060 Ti在4K分辨率下都只有22帧。

    NVIDIA GeForce RTX 3060评测
    《无主之地3》

    《无主之地3》是一款采用了卡通渲染风格的游戏。在1080P分辨率下,包括RTX 2060也能流畅运行,而高分辨率则帧数下降明显,比号称众生平等的刺客信条还要低一些。

    05 功耗测试

    在温度功耗测试方面,室温24℃,另外由于此次的GeForce RTX 3060并没有公版发布,我们使用了iGame GeForce RTX 3060 Ultra W 12G这张非公版显卡,所以也就不牵扯温度的问题,不过我们也可以看一下这款显卡实际的温度表现。

    NVIDIA GeForce RTX 3060评测
    功耗测试(点击查看大图)

    功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。作为一款GeForce RTX 30系入门显卡,GeForce RTX 3060的功耗要小很多,在峰值情况下整体平均在160W左右。

    温度方面,本次的GeForce RTX 3060经过15分钟左右的拷机,温度稳定为58℃左右,可见在体积相同的情况下,低功耗的入门卡即便在小幅超频的情况下,温度控制的还是非常不错的。

    06 部分游戏光追及DLSS效果展示

    上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。

    微星RTX 3080超龙评测:
    《赛博朋克2077》RTX ON(点击查看大图)

    微星RTX 3080超龙评测:
    《赛博朋克2077》RTX OFF(点击查看大图)

    在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。

    NVIDIA 3060 Ti首测
    堡垒之夜》RTX ON(点击查看大图)

    NVIDIA 3060 Ti首测
    《堡垒之夜》RTX OFF(点击查看大图)

    堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。

    NVIDIA 3060 Ti首测
    《魔兽世界9.0》RTX ON(点击查看大图)

    NVIDIA 3060 Ti首测
    《魔兽世界9.0》RTX OFF(点击查看大图)

    《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。

    NVIDIA 3060 Ti首测
    《控制》RTX ON(点击查看大图)

    NVIDIA 3060 Ti首测
    《控制》RTX OFF(点击查看大图)

    《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。

    都是别人的赛博朋克!我究竟玩了个啥
    DLSS模式对比

    DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。

    07 软硬兼施 铸就Ampere

    好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。

    NVIDIA Reflex

    以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?

    NVIDIA RTX 3070首测 比肩RTX 2080Ti
    NVIDIA Reflex

    在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。

    以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。

    NVIDIA Broadcast

    NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。

    业余设备专业效果 NV Broadcast软件直播体验
    宠物派对直播

    这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。

    业余设备专业效果 NV Broadcast软件直播体验
    NVENC编码

    同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。

    NVIDIA Studio

    对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。

    NVIDIA RTX 3070首测 比肩RTX 2080Ti
    NVIDIA Studio

    NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。

    华硕TUF RTX 3090 24G GAMING显卡评测:斗尊强者 恐怖如斯
    以GPU渲染为14.98秒 而CPU渲染为11分钟

    当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、KeyshotBlender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。

    08 性能看齐GeForce RTX 2070

    GeForce RTX 3060作为GeForce RTX 30系的入门级显卡,在性能上拥有比肩RTX 2070的水平,单纯以官方指导价2499元来说已经是非常具有性价比了。

    iGame RTX 3060 Ultra W OC首测
    iGame GeForce RTX 3060 Ultra W 12G

    在性能参数上,GeForce RTX 3060的Boost频率为1777MHz,以目前GeForce RTX 30系显卡全新的NVIDIA Ampere架构来说,采用了第二代RT Core和第三代Tensor Core,在光线追踪和AI学习方面都有不同程度加强,还拥有更高的能耗比。在游戏上大部分3A游戏都能在2K分辨率下流畅运行。

    iGame RTX 3060 Ultra W OC首测
    iGame GeForce RTX 3060 Ultra W 12G

    GeForce RTX 3060除了性能跑分之外最大的特点就是采用了12GB大显存,比GeForce RTX 3080还要多出2GB。单纯以显存来说,除了高分辨率方面的优势外,对于内容创作者处理更高分辨率的素材、多开应用以及最终的渲染导出都有很大帮助。

    所以目前除了GeForce RTX 3090这张专业的内容创作显卡外,GeForce RTX 3060同样是内容创作者不错的选择,并且价格相差5倍。作为一张如此“全能”的显卡,它有点强大的不像入门级产品,目前各大品牌的GeForce RTX 3060已经全部上架开售,感兴趣的用户不妨抓紧时间抢购。

    本文属于原创文章,如若转载,请注明来源:NVIDIA GeForce RTX 3060评测 12G显存的全能卡https://diy.zol.com.cn/762/7628068.html

    diy.zol.com.cn true https://diy.zol.com.cn/762/7628068.html report 12960 NVIDIA RTX 30系显卡发布会已经过去了半年时间,在此期间NVIDIA先后发布了GeForce RTX 3080/3090/3070/3060 Ti系列GPU。现在定位入门级的产品GeForce RTX 3060也终于发布,完成了从顶级旗舰到入门级的全线布局,可以说近半年来NVIDIA风头无两。全新的RTX 30系GPU再次实现...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    • 第1页:NVIDIA RTX 3060评测
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • DIY组装电脑
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错