近期正值618电商节,不少用户都打算趁着优惠活动攒机,而不久前发布的RTX 4060 Ti对于主流用户来说,价格已经非常实惠了,现在入手正是好时机。今天评测的产品为COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡。
关于COLORFIRE这个品牌关注显卡市场的可能有所了解,它是七彩虹旗下全新品牌,相比iGame的游戏、硬朗风格,它更注重年轻人的潮文化,不拘泥于传统表现形式。
本次推出的“大橘”显卡就是全新MEOW系列产品,它融合了猫咪的元素以及配色,打造出外观与性能兼具的硬件。下面让我们来看看这款猫卡的外观有何不同。
(除了本次评测的RTX 4060 Ti,这款猫猫显卡还有RTX 4070型号哦)
1 COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡概览
COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡的外包装相当俏皮可爱,IP橘宝站在中间,四周则有一些卡通造型的周边玩具,整体以嫩橘色为主。
由于此次RTX 4060 Ti功耗大幅减小,整卡TDP仅为160W,所以也无需配备转接线,装机理线更清爽。
COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB整卡尺寸为331×134×46mm(含挡板),占用2槽空间。
COLORFIRE MEOW系列显卡融合了橘猫的元素及配色,橘与灰白的运用还原橘猫毛色,即便玩家没有养宠物,也能够通过MEOW系列的硬件产品获得“吸猫”般的乐趣。
在内部散热上,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB采用了2根6mm热管,搭配“回流焊”工艺,使热管与鳍片紧密接触,优化散热效能,实现优异的散热效果。
另外芯片功耗下降,发热量减小,这张显卡背板没有对核心进行镂空处理,看起来整体性更强。
COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡侧面可以看到单8pin供电接口,只需550W电源即可,对老用户升级绝对是福音。
2 NVIDIA GeForce RTX 4060 Ti 8GB架构浅析
本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了恐怖的760亿个晶体管,而在RTX 30系显卡中为280亿个。
与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。
本次发布的RTX 4060 Ti 8GBB共有4352个CUDA核心,提供了22-TFLOPS算力;34个第三代Ada RT Core拥有51 RT-TFLOPS;136个第四代Tensor Core可提供353 Tensor-TFLOPS。
另外在本次的规格说明上,NVIDIA官方也特别表明了L2 Cache容量以及最终的等效带宽,这是RTX 40在架构中变化比较大的地方,同时也是玩家对位宽减小有争议的“罪魁祸首”。
我们以两张图来简单说明L2缓存的作用。
如果把GPU内核比作网店店主,那么L1缓存就是在日常工作的屋子中堆放的可发货产品,但由于所有工作都要在这间屋子进行,堆放产品的空间有限;所以大部分产品就需要到L2缓存中,它就好比在工作室隔壁的仓库,虽然需要走出去,但仍然是很近的路程。
如果这个仓库还是放不下,那么只能到更远的显存中去调取产品。当然如果有爆显存的情况,那么这位“店主”可能还要打车去更远的系统内存区调取数据。
这中间的路程和耗费时间就好比GPU额外的工作量,如果绝大部分数据只存放在L2缓存就可以拿到,那么将极大节省功耗。并且由于不再需要频繁调取显存中的数据,所以显存位宽适当降低,对于运行效率也是没有影响的。
在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。
然而,由于L1缓存需要离内核非常近,不可能非常大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。
如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
其实如果只对比传统的光栅性能,RTX 4060 Ti 8GB的进步并没有很大,但在AI逐渐发展的今天,需要大量逻辑推理运算,所以可以看到相比30系的Tensor算力,几乎达到1.7倍的提升。
完整的AD102核心
完整的AD106核心
RTX 4060 Ti 8GBB使用的AD106核心
本次RTX 4060 Ti 8GB使用了AD106芯片,采用了3组GPC,其中1组少了1组TPC,并且NVENC单元变为2个。
这张RTX 4060 Ti 8GB的L2缓存为32MB,而上一代RTX 3060 Ti为4MB,达到了8倍的差距。增加L2缓存的大小可以提高性能,降低延迟,并提高续航时长,数据访问在GPU上即可完成(否则GPU就要频繁从显存读取数据,过分依赖显存带宽)。所以,这也是为什么在RTX 40系显卡中,位宽带宽普遍偏小的原因。
3 测试平台简介
首先介绍一下测试平台,为了保障COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB的性能发挥,我们的平台也进行了全面更新。
目前GPU-Z版本尚未更新,部分信息无法识别,简单参考即可。
RTX 4060 Ti 8GBB采用AD106核心,拥有4352个CUDA,Boost频率为2535MHz,RTX 3060 Ti则为1665MHz,提升非常大。
采用8GBBB GDDR6显存,位宽为128bit,显存带宽288 GB/s(最终等效带宽554 GB/s),光栅单元和纹理单元为48和136。
4 理论性能测试
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在针对显卡DX11性能的3DMARKFS套装测试中,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB主要对比上一代RTX 3060 Ti,其中FS提升了18%;FSE提升了12%;FSU提升了1%,综合来看相比RTX 3070 Ti的性能提升约为10%。
而对比刚刚发布的RTX 4070,综合成绩相差26%左右。
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB相较RTX 3060 Ti的提升分别为:TS提升14%;TSE提升8%,综合约为11%。
PortRoyal是3DMARK中专门针对光追性能的测试项,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB相较RTX 3060 Ti的提升约为17%。
综合来看,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB的传统理论性能相较RTX 3060 Ti的提升约为13%。
Speed Way测试是3DMARK最新更新的用于测试DirectX12 Ultimate 性能的显卡基准测试。要运行此测试,显卡必须支持 DirectX 12 Ultimate 并包含 6GB 及以上显存。
这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。并且有意思的是,Speed Way测试支持自由探索场景,可查看光照及摄像机设置的改变如何影响视觉效果。
COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB对比RTX 3060 Ti显卡,从1080p分辨率到4K提升依次为:12%/10%/6%。
另外我们使用3DMARK刚刚更新的DLSS 3进行了相关性能测试。不过由于RTX 3060 Ti无法开启,这里使用DLSS2进行对比测试。
在2K分辨率下COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡,DLSS开关相比RTX 3060 Ti的提升为24%/16%;4K分辨率由于关闭情况下显卡几乎无法正常运行,仅看开启状态,提升约为51%。
5 《暗黑破坏神4》测试
作为刚刚发布的热门爆款大作,本次我们单独对《暗黑破坏神4》进行了测试,包括画质对比及最近加入的DLSS3。
(点击图片查看大图)
《暗黑破坏神4》共分为4档画质,虽然作为一款刷宝性质的游戏,但低画质整体效果也非常惨不忍睹,感觉是贴图没有加载,第一张图片为4K分辨率下超高画质原图。
整体来看,高画质下的表现与超高画质几乎无异,两者的区别在于一些细节上的纹理质量和阴影质量。
《暗黑破坏神4》加入了DLSS以及DLSS3,而DLSS 3的帧生成功能则需要RTX 40系显卡才能够开启,下面来看看不同分辨率以及不同DLSS的效果对比。
RTX 4060 Ti作为一款甜品卡,在3A游戏中定位1080p分辨率下,光追百帧游戏体验。不过《暗黑破坏神4》从游戏玩法和模式来说,对于硬件要求注定不会太高,即便在4K分辨率下也能达到流畅效果。
以上测试均在超级画质、DLSS质量模式下进行:
可以看到1080p分辨率即使关闭DLSS,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡也能达到200帧的水准,而开启DLSS质量模式后,帧数提升23%;开启DLSS 3后,帧数提升达到36%。
在2K分辨率下开启DLSS帧数提升40%,而开启DLSS 3后几乎相同。比较有意思的是,在4K分辨率下,开启DLSS 3帧率不升反降,其实整张表格的数据也反映了DLSS的工作原理。
在1080p分辨率下,CPU的利用率更高,但仍没有达到瓶颈,所以开启DLSS 2后,有较大提升。这时候显卡仍有余力,所以在开启DLSS 3帧生成后,相较DLSS 2还有10%左右的提升,相当于把CPU和GPU都发挥到了极致。
而在2K分辨率下,原本帧数瓶颈已经在显卡,所以在开启DLSS 3后,超分辨率加上帧生成,虽然没有达到“入不敷出”,但也无法再提供更高的帧数了。
在4K分辨率中,开启DLSS 2已经达到了显卡极限,DLSS 3的帧生成反而成了负担。
不过以RTX 4060 Ti本身的1080p定位以及各项规格来看,2K分辨率的成绩已经是相当惊喜了。
6 常规游戏 性能测试
下面我们对这款显卡分别进行了不同类别的游戏测试,其中包含传统光栅化游戏,也有纯光追+DLSS的benchmark跑分测试。
在《极限竞速:地平线5》中,加入了DLSS 3,我们在后面会进行相关测试,这里仅看常规对比。
性能方面,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB相比RTX 3060 Ti的提升分别为:1080p提升12%;2K提升9%;4K提升8%,综合提升10%。
由于RTX 4060 Ti 8GBB这张显卡本身定位1080p分辨率,在部分2K游戏中会爆显存,所以在越高的分辨率下其实对比RTX 3060 Ti的优势不大。
在《刺客信条:英灵殿》中,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB相比RTX 3060 Ti的提升分别为:1080p提升12%;2K提升7%;4K提升4%,综合提升8%。
在《无主之地3》中,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB相比RTX 3060 Ti的提升分别为:1080p提升13%;2K提升11%;4K提升5%,综合提升10%。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。所以测试帧数相对较低,但实际游戏配置相当亲民。
性能方面,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB相比RTX 3060 Ti的提升分别为:1080p提升26%;2K提升23%;4K提升5%,综合提升18%。
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
在《边境》中,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB相比RTX 3060 Ti的提升分别为:1080p提升36%;2K提升25%;4K提升17%,综合提升26%。
在《赛博朋克2077》中,游戏新增了光追过载画质,我们分别进行了测试。
在超级画质中,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB相比RTX 3060 Ti的提升分别为,1080p提升13%;2K提升4%;4K提升6%,综合提升8%。
在光追超级画质中,提升分别为,1080p提升18%;2K提升16%;4K提升15%,综合提升16%。
在光追过载画质中,由于对性能需求实在变态,所以仅测试1080p及2K分辨率,提升分别为,1080p提升26%;2K提升41%。
这里分别为大家展示一下三种不同画质,从上至下依次为超级画质/光追超级/光追过载。可以看到光追过载相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。
这也是NVIDIA致力于打造的下一代光追场景,但是截止目前它对硬件计算的需求太过庞大,即便是旗舰显卡,也无法在4K分辨率下流畅运行。
7 DLSS 3性能测试
截止目前,已有超过300款游戏和应用支持DLSS,其中超过30款游戏已经支持最新的DLSS 3。
包括《逆水寒》、《微软模拟飞行》、《毁灭全人类2:重新探测》、《瘟疫传说:安魂曲》、《光明记忆:无限》、《暗影火炬城》、《F1 22》、《生死轮回》、《漫威蜘蛛侠:重制版》、《超级人类》、《极限竞速:地平线5》、《赛博朋克2077》、《红霞岛》、《暗黑破坏神4》、《侏罗纪世界:进化2》等等。
下面就让我们来实际测试,拥有全新的DLSS 3的游戏,能达到何种帧率。
本次DLSS 3的测试图表比较繁琐,并且增加了1% Low FPS和延迟的测试,普通的FPS好理解,那么这个1% Low FPS是什么意思。
首先,游戏benchmark通常测试的FPS即为,一段时间内的游戏平均帧。而1% Low FPS则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。
其实简单来说,这两个数值都不能代表我们在游玩时,具体哪一刻的感受,但FPS更注重整体,而1% Low FPS则是从最差的里面求平均,更谨慎一些。
在《侏罗纪世界:进化2》中,DLSS 3的表现非常亮眼,由于此类模拟经营游戏的特点就是同屏单位多,更加占用CPU资源,而DLSS 3能够进行帧生成,来突破CPU瓶颈限制。
在《赛博朋克2077》中的数据反映了比较真实的3A大作表现,可以看到在DLSS关/光追超级的情况下,COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡只有45帧,并且延迟达到了42.8毫秒。
而在开启DLSS 3后,帧数为120,提升了167%。虽然相比DLSS 2的延迟高了13毫秒左右,但依然维持在较低的水平。
在《巫师3》光线追踪的测试中,由于没有benchmark,我们选择画面元素较多的固定场景截取帧数,故1% Low帧数较高。
COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB即便在DLSS 2开启的情况下也仅能勉强维持流畅帧数,但DLSS 3能够提供百帧的流畅体验。
《极限竞速:地平线5》是最新加入DLSS 3的游戏,对于显卡优化十分到位,在1080p分辨率下,游戏帧数受到CPU瓶颈限制,所以即便COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡开启DLSS 2,帧数依然相同。而在开启DLSS 3后,显卡仍有发挥空间,让帧数能够再提升18%。
《暗影火炬城》在开启光追后对于性能要求明显提高。其中COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB显卡开启DLSS 3相比DLSS关的帧数提升了50%,DLSS 2的提升则达到了36%。
在UE5提供的测试游戏中,方便的给出了DLSS的快捷测试,这里分为DLSS关(超分辨率关+帧生成关+Reflex关);DLSS 2(超分辨率性能+帧生成关+Reflex开);DLSS 3(超分辨率性能+帧生成开+Reflex开)三档测试。
另外,由于Lyra帧数均为静态所得,1% Low的分数相比其他游戏更高一些。
Lyra是典型显卡要求高过CPU要求的游戏测试demo,其中COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB在DLSS关的情况下,即便1080p分辨率也只有89帧,而开启DLSS 3后,帧数直接提升1倍。
8 Stable Diffusion AI绘画测试
除了游戏之外,AI也是目前大火的领域,尤其以Stable Diffusion为最,现在很多AI生成的图片完全能够以假乱真,下面我们也来测试一下RTX 4060 Ti 8GBB在这方面的表现。
Stable Diffusion可以说几乎没有门槛,但本地部署的繁琐程度劝退了很多用户。上图为操作界面用户可根据自己想要生成的图片细节丰富关键词。
按照NVIDIA提供的关键词,我们生成了10批,共20张图片。并对比了刚刚发布的RTX 4070和上一代RTX 3060 Ti显卡。
RTX 4070运算时间 2m24.79s 约合 7.2秒一张图
COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB运算时间3m18.26s 约合 9.9秒一张图
RTX 3060 Ti运算时间3m40.86s 约合 11秒一张图
Stable Diffusion对于显卡的要求比较高,它的硬性需求为显存,而运算时间则主要看Tensor算力。
我们对比了RTX 4060 Ti 8GBB和RTX 3060 Ti在相同设置下的运算时间,两款显卡在生成20张图片的时间差距为22秒,差距还是比较大的。
另外我们也测试了使用CPU,在相同设置下生成图片,但如图片所示,保守估计需要3小时30分左右。
9 AV1编码测试
本次AV1编码测试选择了剪映专业版,它可以输出H.264/HEVC/AV1三种编码格式的视频。
剪映专业版目前自带AV1编码输出,在实际测试中,我们导出一段1分钟左右的视频。可以看到两个文件容量相差103MB。
由于AV1编码特性,生成文件的比特率更低,但视频清晰度则完全相同。所以如果生成同比特率,同容量的文件,AV1将会更清晰。
我们通过NVIDIA ICAT来进行两段视频的画面对比,图中左侧为H.264编码,右侧为AV1编码,几乎看不出任何区别。
10 RTX VSR(RTX Video Super Resolution)测试
目前RTX VSR(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。
RTX VSR是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。
开启RTX VSR不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。
(点击放大查看原图)
我们打开YouTube随意观看视频,在打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。
11 温度及功耗测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
可以看到COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB这张显卡但通过30分钟左右的拷机测试,温度一直控制在59℃左右,热点温度在68℃左右。作为一张平价显卡,散热表现十分优秀。
游戏动态功耗测试
COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB 3A游戏平均功耗
RTX 3060 Ti 3A游戏平均功耗
在实际的游戏功耗测试中,我们选择《赛博朋克2077》自带benchmark,画面设置为光追超级、2K分辨率,来拉满两张显卡的性能极限,检测我们实际应用场景的功耗。
可以看到两款显卡虽然均为60级别,但这款COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB平均功耗为152W,而RTX 3060 Ti则是219W,低了67W。
12 猫卡!
这个世界没有猫猫都不可能转的!
猫猫教拯救世界!
这张COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB是第一张以猫咪为主题的显卡,作为最受喜爱的伴侣宠物之一,目前有猫家庭越来越多,这其中有相当大一部分人对那些炫酷显卡无感,更希望拥有一款生活气息浓厚,兼具可爱和性能的产品。
大橘显卡在定位上介于生活娱乐、游戏和生产力创作之间,卡身充满了猫猫元素。不过显卡背板的脚步涟漪效果,如果能做成不规则的呼吸灯,真正模仿猫猫走过的效果,一定会让有猫一族为之疯狂。但这样一来成本也势必会增加,对于一个平价系列显卡来说,确实不太划算。
产品本身方面,RTX 4060 Ti在发售之初虽然饱受争议,但从实际装机市场来看,需求量还是很大的。并且作为一张甜品卡来看,在光追方面的表现确实比较亮眼,1080p光追百帧,这在几年前的60级别显卡上是不敢像的。
另外NVIDIA大力推荐的光追和DLSS,目前正在越来越多的游戏中被应用到,但凡叫得上名字的大作都能见到它的身影,几乎成为了游戏必不可少的工具。
而随着不断迭代升级,相比几年前的版本,即便在1080p分辨率下开启DLSS,画质仍然得到了保障。
功耗方面,3A游戏平均150W左右,建议电源550W起步,对于老用户升级非常友好。虽然现在有很多人觉得“我差你省下的那点功耗吗?”。
但以我自己来说,目前正在使用RTX 3080 Ti显卡,整卡功耗350W,在3A游戏中整机轻轻松松450W左右。如果每天只玩一两个小时不觉得,但时间长了,这确实是一笔不小的钱。
这张COLORFIRE GeForce RTX 4060 Ti 橘影橙 8GB更适合手持RTX 20系或更早的玩家升级,在价格与RTX 3060 Ti差不多的情况下,它大幅提升了光追和Tensor算力,不仅在消游戏中有用,在AI绘画这些应用中,也有很大的效率提升。
而且作为第一张猫卡,还是3199的原价卡,对于正打算攒机的有猫一族来说,简直是不二之选。随着60级别甜品卡的发布,6000元主流价位的攒机需求,完全可以买到最新的RTX 40系显卡。无论工作还是生活娱乐,都是一笔划算的投入。
本文属于原创文章,如若转载,请注明来源:COLORFIRE RTX 4060 Ti橘影橙评测 猫猫显卡来也https://diy.zol.com.cn/820/8206508.html