RTX 40系显卡目前共发布了6张显卡,横跨60-90级别,也让玩家在不同价位段都有可选型号。今天带来的为微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙显卡评测。
尽管高分高刷显示器已经宣传多年,但根据Steam硬件调查榜显示,62%的游戏玩家,仍在使用1080p分辨率显示器,虽然呈现逐步下降趋势,但排名第二的2K分辨率,目前仅占13.23%。
并且从显卡占有率来说,前五名共有4款60级显卡,所以甜品级显卡仍是绝大部分玩家首选,在保障基础分辨率性能足够的前提,价格足够实惠。
随着60级别显卡的发布,也让攒机预算整体控制在6000元以内,而且还能在1080p分辨率下畅享百帧光追游戏,如果你现在手持RTX 20系或更早的产品,非常推荐升级。
1 微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙概览
本次微星RTX 4060 Ti GAMING X TRIO 8G魔龙显卡在配件方面,由于采用了单8pin供电,所以无需电源转换线。但由于显卡采用了三风扇散热,整体尺寸和重量依然较大,所以配备了一个金属显卡支架。
RTX 4060 Ti魔龙
RTX 3060 Ti魔龙
微星RTX 4060 Ti GAMING X TRIO 8G魔龙相比此前推出的魔龙有些区别,整体在线条上进行了简化,造型规整。整卡尺寸为338×141×52mm,相比70和80级别的型号尺寸小很多。
微星RTX 4060 Ti GAMING X TRIO 8G魔龙采用TRI FROZR 3代散热系统,主动散热部分为3个刀锋7代风扇,支持智能启停,在空载状态下有效减少噪音延长风扇寿命。三组倾斜22度的扇叶连成环形,慢转速下也能保持高压气流。扇叶边缘新增特殊构造风扇罩,大幅提高气流稳定性并能降低噪音。
从风扇边缘的细节能看到,本代魔龙增加了龙鳞状点缀,虽然面积不大,但意境传达到位,让人很容易联想到魔龙的系列名称。
微星RTX 4060 Ti GAMING X TRIO 8G魔龙采用一体压铸的金属背板,从背部能够明显看到,PCB几乎只有整卡的一半大小,大面积的散热鳍片裸露在外,为显卡的散热提供了良好的表现。不过由于背板镂空面积扩大,龙盾的logo和GeForce RTX标志只能“见缝插针”的排布。
微星RTX 4060 Ti GAMING X TRIO 8G魔龙内部散热采用镀镍铜底座,可将GPU核心和显存颗粒产生的热量迅速传导到热管上,提升整体散热效率。
从细节放大图片中能够看到,微星采用了全新改进的气流导向技术,大幅增加了散热鳍片的密度,并对不同位置的散热鳍片形状精心微调,增加了导流鳍片的设计,从而尽可能提升气流流动效率,改善散热效能和噪音。
微星RTX 4060 Ti GAMING X TRIO 8G魔龙侧面可以看到单8pin供电接口,只需550W电源即可,对老用户升级绝对是福音。
视频输出接口上,依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。
上机点亮后的魔龙才更有气势,这个爪印造型的灯光在40系中更有质感,整体贯穿正面导流罩与侧面,并且色彩饱和度高,灯光无逸散。
2 NVIDIA GeForce RTX 4060 Ti 8GB架构浅析
本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了760亿个晶体管,而在RTX 30系显卡中为280亿个。
与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。
本次发布的RTX 4060 Ti 8GB共有4352个CUDA核心,提供了22-TFLOPS算力;34个第三代Ada RT Core拥有51 RT-TFLOPS;136个第四代Tensor Core可提供353 Tensor-TFLOPS。
另外在本次的规格说明上,NVIDIA官方也特别表明了L2 Cache容量以及最终的等效带宽,这是RTX 40在架构中变化比较大的地方,同时也是玩家对位宽减小有争议的“罪魁祸首”。
我们以两张图来简单说明L2缓存的作用。
如果把GPU内核比作网店店主,那么L1缓存就是在日常工作的屋子中堆放的可发货产品,但由于所有工作都要在这间屋子进行,堆放产品的空间有限;所以大部分产品就需要到L2缓存中,它就好比在工作室隔壁的仓库,虽然需要走出去,但仍然是很近的路程。
如果这个仓库还是放不下,那么只能到更远的显存中去调取产品。当然如果有爆显存的情况,那么这位“店主”可能还要打车去更远的系统内存区调取数据。
这中间的路程和耗费时间就好比GPU额外的工作量,如果绝大部分数据只存放在L2缓存就可以拿到,那么将极大节省功耗。并且由于不再需要频繁调取显存中的数据,所以显存位宽适当降低,对于运行效率也是没有影响的。
在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。
然而,由于L1缓存需要离内核非常近,不可能非常大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。
如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
其实如果只对比传统的光栅性能,RTX 4060 Ti 8GB的进步并没有很大,但在AI逐渐发展的今天,需要大量逻辑推理运算,所以可以看到相比30系的Tensor算力,几乎达到1.7倍的提升。
完整的AD102核心
完整的AD106核心
RTX 4060 Ti 8GB使用的AD106核心
本次RTX 4060 Ti 8GB使用了AD106芯片,采用了3组GPC,其中1组少了1组TPC,并且NVENC单元变为2个。
这张RTX 4060 Ti 8GB的L2缓存为32MB,而上一代RTX 3060 Ti为4MB,达到了8倍的差距。增加L2缓存的大小可以提高性能,降低延迟,并提高续航时长,数据访问在GPU上即可完成(否则GPU就要频繁从显存读取数据,过分依赖显存带宽)。所以,这也是为什么在RTX 40系显卡中,位宽带宽普遍偏小的原因。
3 测试平台简介
首先介绍一下测试平台,为了保障微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙的性能发挥,我们的平台也进行了全面更新。
目前最新的2.54 GPU-Z版本已经可以识别RTX 4060 Ti和RTX 4060显卡详细信息。
微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙采用AD106核心,拥有4352个CUDA,Boost频率为2670MHz,相比公版的2580MHz提升较大,而相比RTX 3060 Ti的1665MHz,提升更大。
采用8GB GDDR6显存,位宽为128bit,显存带宽288 GB/s(最终等效带宽554 GB/s),光栅单元和纹理单元为48和136。
4 理论性能测试
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在针对显卡DX11性能的3DMARKFS套装测试中,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙主要对比上一代RTX 3060 Ti,其中FS提升了18%;FSE提升了14%;FSU提升了1%,综合来看相比RTX 3070 Ti的性能提升约为11%。
而对比刚刚发布的RTX 4070,综合成绩相差25%左右。
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙相较RTX 3060 Ti的提升分别为:TS提升13%;TSE提升8%,综合约为11%。
PortRoyal是3DMARK中专门针对光追性能的测试项,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙相较RTX 3060 Ti的提升约为16%。
综合来看,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙的传统理论性能相较RTX 3060 Ti的提升约为13%。
Speed Way测试是3DMARK最新更新的用于测试DirectX12 Ultimate 性能的显卡基准测试。要运行此测试,显卡必须支持 DirectX 12 Ultimate 并包含 6GB 及以上显存。
这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。
微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙对比RTX 3060 Ti显卡,从1080p分辨率到4K提升依次为:12%/10%/7%。
另外我们使用3DMARK刚刚更新的DLSS 3进行了相关性能测试。不过由于RTX 3060 Ti无法开启,这里使用DLSS2进行对比测试。
在2K分辨率下DLSS开关相比RTX 3060 Ti的提升为26%/16%;4K分辨率由于关闭情况下显卡几乎无法正常运行,仅看开启状态,提升约为54%。
5 游戏 性能测试
下面我们对这款显卡分别进行了不同类别的游戏测试,其中包含传统光栅化游戏,也有纯光追+DLSS的benchmark跑分测试。
在《极限竞速:地平线5》中,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙相比RTX 3060 Ti的提升分别为:1080p提升12%;2K提升9%;4K提升8%,综合提升10%。
由于RTX 4060 Ti 8GB这张显卡本身定位1080p分辨率,在部分2K游戏中会爆显存,所以在越高的分辨率下其实对比RTX 3060 Ti的优势不大。
在新游《暗黑破坏神4》中,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙表现亮眼,由于这款游戏面向的是更多主流配置玩家,在配置上相当亲民,不过本代暗黑中的画质提升却非常大,堪称优化典范。
虽然这张RTX 4060 Ti定位1080p甜品卡,但从暗黑的测试中能够看到,在主流网游中,他依然能在2K分辨率下达到电竞级流畅帧率。不过目前DLSS 3的优化似乎尚有问题,在4K分辨率下并没有提升,反而降了不少。
在《刺客信条:英灵殿》中,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙相比RTX 3060 Ti的提升分别为:1080p提升12%;2K提升9%;4K提升4%,综合提升8%。
在《无主之地3》中,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙相比RTX 3060 Ti的提升分别为:1080p提升13%;2K提升13%;4K提升5%,综合提升10%。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。所以测试帧数相对较低,但实际游戏配置相当亲民。
性能方面,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙相比RTX 3060 Ti的提升分别为:1080p提升26%;2K提升23%;4K提升9%,综合提升19%。
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
在《边境》中,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙相比RTX 3060 Ti的提升分别为:1080p提升36%;2K提升27%;4K提升17%,综合提升27%。
在《赛博朋克2077》中,游戏新增了光追过载画质,我们分别进行了测试。
在超级画质中,微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙相比RTX 3060 Ti的提升分别为,1080p提升13%;2K提升4%;4K提升6%,综合提升8%。
在光追超级画质中,提升分别为,1080p提升18%;2K提升16%;4K提升15%,综合提升16%。
在光追过载画质中,由于对性能需求实在变态,所以仅测试1080p及2K分辨率,提升分别为,1080p提升26%;2K提升41%。
这里分别为大家展示一下三种不同画质,从上至下依次为超级画质/光追超级/光追过载。可以看到光追过载相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。
这也是NVIDIA致力于打造的下一代光追场景,但是截止目前它对硬件计算的需求太过庞大,即便是旗舰显卡,也无法在4K分辨率下流畅运行。
6 Stable Diffusion AI绘画测试
除了游戏之外,AI也是目前大火的领域,尤其以Stable Diffusion为最,现在很多AI生成的图片完全能够以假乱真,下面我们也来测试一下RTX 4060 Ti 8GB在这方面的表现。
按照NVIDIA提供的关键词,我们生成了10批,共20张图片。并对比了刚刚发布的RTX 4070和上一代RTX 3060 Ti显卡。
RTX 4070运算时间 2m24.79s 约合 7.2秒一张图
RTX 4060 Ti 8GB运算时间3m18.26s 约合 9.9秒一张图
RTX 3060 Ti运算时间3m40.86s 约合 11秒一张图
Stable Diffusion对于显卡的要求比较高,这就需要显卡拥有较强的Tensor算力。
另外它对于显存的要求非常高,此次RTX 4060 Ti 8GB显存使用率已达到97%,如果有条件的话尽量选择大容量显存的显卡。
我们对比了RTX 4060 Ti 8GB和RTX 3060 Ti在相同设置下的运算时间,两款显卡在生成20张图片的时间差距为22秒,差距还是比较大的。
另外我们也测试了使用CPU,在相同设置下生成图片,但如图片所示,保守估计需要3小时30分左右。
7 AV1编码测试
本次AV1编码测试选择了剪映专业版,它可以输出H.264/HEVC/AV1三种编码格式的视频。
剪映专业版目前自带AV1编码输出,在实际测试中,我们导出一段1分钟左右的视频。可以看到两个文件容量相差103MB。
由于AV1编码特性,生成文件的比特率更低,但视频清晰度则完全相同。所以如果生成同比特率,同容量的文件,AV1将会更清晰。
我们通过NVIDIA ICAT来进行两段视频的画面对比,图中左侧为H.264编码,右侧为AV1编码,几乎看不出任何区别。
8 RTX VSR(RTX Video Super Resolution)测试
目前RTX VSR(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。
RTX VSR是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。
开启RTX VSR不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。
(点击放大查看原图)
我们打开YouTube随意观看视频,在打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。
9 温度及功耗测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
可以看到微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙这张显卡但通过25分钟左右的拷机测试,温度控制在55℃左右,热点温度在66℃左右,相比我们测试的双风扇显卡温度更低。
游戏动态功耗测试
微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙 3A游戏平均功耗
RTX 3060 Ti 3A游戏平均功耗
在实际的游戏功耗测试中,我们选择《赛博朋克2077》自带benchmark,画面设置为光追超级、2K分辨率,来拉满两张显卡的性能极限,检测我们实际应用场景的功耗。
可以看到两款显卡虽然均为60级别,但这款微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙平均功耗为157W,而RTX 3060 Ti则是219W,低了62W。
10 极致 冷·静
微星魔龙算是玩家熟知的系列了,在超龙没有推出之前一直是旗舰的存在,虽然目前为次旗舰,但用料和规格依然没有变。
本次我们测试的微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙为三风扇版本,对于这张RTX 4060 Ti来说确实是有些夸张的规格。
不过大家要知道显卡其实同样算是“消耗品”,后期最影响性能发挥的就是温度。虽然显卡即便在80℃也算正常区间,但GPU长时间在高温状态下工作,对寿命有很大影响。而这张三风扇魔龙满载拷机温度只有55℃左右,给GPU一个“舒适”的工作环境,可极大延长显卡寿命。
当然,如果机箱对显卡长度有限制,或者有ITX装机需求的玩家,大可以考虑双风魔龙,价格还能更便宜一些。
性能方面,虽然在发布后玩家一直抱怨提升不大,不过这也要从两方面来说。
传统的光栅性能,RTX 4060 Ti相比RTX 3060 Ti提升13%左右,确实差强人意。而光追和AI计算方面,通过上面不同游戏的测试,能够看到相比RTX 3060 Ti整体提升在25-35%之间。
可以说RTX 4060 Ti经过几个系列的迭代,真正做到了甜品卡可畅玩光追游戏。
NVIDIA的产品,历代60级都是定位1080p游戏,即便现在GTX 1060也能流畅玩大部分。所以如果你只是玩一些独立游戏,或是老的3A游戏,手中又是RTX 3060 Ti这样的上一代产品,那么确实没有升级的必要。
功耗方面,RTX 4060 Ti 8GB继承了RTX 40系显卡优良传统,160W功耗,单8pin供电,建议电源550W起步。虽然大部分玩家感觉“我不差你那点电费”,但能耗比提升终归是好使,且对于老电脑想升级的玩家来说,这也是利好消息,毕竟换电源的麻烦程度不亚于重新攒机。
目前这张微星GeForce RTX 4060 Ti GAMING X TRIO 8G魔龙售价3599元,有兴趣的朋友不妨关注起来。
本文属于原创文章,如若转载,请注明来源:微星RTX 4060 Ti魔龙评测 极致 冷·静https://diy.zol.com.cn/824/8243797.html