索尼承诺将“增加PS5主机供应”
2023-01-31
更新时间:2022-10-13 15:11:11作者:智慧百科
2022年10月11日,NVIDIA正式发布了全新的GeForce RTX 40系列显卡的旗舰产品——GeForce RTX 4090显卡,采用新一代NVIDIA Ada Lovelace架构,并为广大游戏玩家们带来更强大的DLSS3,公版RTX 4090将于10月12日正式开售,而各品牌的非公版显卡将延迟至10月15日才会正式上架售卖。
我们有幸收到了华硕的一款TUF GAMING系列RTX 4090显卡,接下来就由小编来为大家详细介绍一下这款全新的性能旗舰显卡,看一看非公版的TUF RTX 4090相比公版RTX 4090显卡能有多少性能提升,做工设计和用料方面又有怎样的特色,借此方便大家在显卡正式发售之后选择购买。
华硕TUF RTX 4090 O24G GAMING显卡
升级的架构和DLSS3技术
GeForce RTX 40系显卡采用全新的NVIDIA Ada Lovelace架构打造,由台积电4N工艺制作,旗舰核心为AD102,集成了763亿集体管,是上代GA102的2.7倍,核心面积大小为608mm²,相比GA102的628mm²更小。
虽然NVIDIA Ada Lovelace架构整体延续了上一代Ampere的架构设计,但依然有一些细节设计上的升级。
RTX 4090所使用的AD 102-300核心架构示意图
RTX 4090作为RTX 40系列显卡的首发旗舰产品,并没有采用完整规格的AD102芯片,而是关闭了8组TPC,在完整AD102芯片72组TPC的基础上保留了64组TPC,每个TPC内有2组SM簇,共128组SM簇。
AD102的SM簇
每个SM簇里包含了64个FP32单元和64个FP32/INT32混合单元,可视作为128个FP32单元,因而每个SM簇内为128个CUDA;每个SM簇还配置了4个纹理单元、1个RT单元、4个Tensor单元,所以RTX 4090显卡拥有16384个流处理器单元、512个纹理单元、128个三代RT单元、512个Tensor单元。
如果单纯比较流处理器数量,RTX 4090是上一代旗舰RTX 3090Ti的1.52倍,理论上性能最大提升幅度大约在50~60%左右,但NVIDIA为Ada Lovelace架构重新设计第三代RT单元和第四代Tensor单元,其中三代RT单元进一步提升光追性能表现,这也是Ada Lovelace架构最大的升级。
2代RT单元
3代RT单元
和Ampere的2代RT单元相比,Ada Lovelace架构的3代RT单元新增加了“不透明微遮盖引擎”(OME)和“微网络位移引擎”(DM-ME)。
这两个引擎能够将光追计算中常遇到的操作进一步分工处理,提高整体效率,在节省更多计算资源的同时提高光追计算效率。
除了架构上的升级之外,DLSS3技术是NVIDIA对外宣称的RTX 40系列显卡的最大卖点,DLSS3也被NVIDIA官方称为神经网络渲染新时代。
根据NVIDIA的介绍,DLSS3技术包含了DLSS2、Reflex和Frame Generation三种NVIDIA技术,其中DLSS2和Reflex已经广泛被玩家们所熟知:DLSS技术是利用低分辨率渲染+AI填充像素的方式实现接近原生分辨率画面并大幅提升帧数的技术,Reflex是利用消除CPU渲染的无用帧,加快GPU的有效帧渲染速度,实现降低游戏响应延迟的技术,只有Frame Generation是这次RTX 40系列显卡所带来的全新技术。
Frame Generation直译为帧生成,该技术可以将光流估计和DLSS相结合,在现有帧之间插入精确的合成帧,实现帧数“翻倍”提升,让玩家获得更流畅的游戏体验,这也是NVIDIA公关敢于信誓旦旦的说RTX 4090显卡性能是RTX 3090Ti显卡4倍的原因——架构提升1倍×Frame Generation提升1倍=4倍性能提升。不过为了降低这“无中生有”的合成帧产生的延迟,DLSS3会强制开启Reflex,玩家无法自己手动关闭。
目前已经有超过35款游戏和应用宣布即将支持DLSS3技术,首批游戏和应用将于10月推出,借助这次RTX 4090显卡首发的机会,我们也有幸可以抢先体验到DLSS3版本的《赛博朋克2077》和《F1 22》《逆水寒》等游戏。
TUF RTX 4090显卡外观(一)
华硕TUF RTX 4090 O24G GAMING显卡采用了超公版三风扇设计,显卡整体长度为34.9cm,高15cm,厚度7.2cm,占用4条PCIe槽位。
显卡外观整体非常简约,黑灰色的哑光表面配合金属材质的导风罩,看上去非常硬派,让显卡整体充满了力量感,低调沉稳的同时又极具压迫感。
华硕TUF RTX 4090 O24G GAMING显卡配置了3个10.5cm直径的双滚珠轴流风扇,更大的散热风扇能为显卡提供更多的风量,帮助显卡快速散热,并且支持智能调速功能,在满足显卡散热需求的同时也很好的兼顾到了低噪音。
导风罩采用一体式压铸成型,并且和合金背板直接连接固定,为显卡提供了更好的整体稳固结构,将PCB完全保护起来。
导风罩的顶部印刷着白色的“GEFORCE RTX”logo,尾端则镶嵌这一块TUF GAMING的ARGB信仰LOGO灯,为显卡增添了一抹亮丽的色彩。
TUF RTX 4090显卡外观(二)
背面是一块全尺寸大小的铝合金背板,与合金导风罩、散热鳍片相互固定,将PCB完全包裹起来,大大提升了显卡的整体稳固性,能够有效保护PCB不变形。
背板的尾端采取了缕空设计,能够让散热风扇产生的气流直接穿过,带走散热鳍片上的热量,达到提高显卡散热效率的目的。
华硕TUF RTX 4090 O24G GAMING显卡采用了双BIOS设计,玩家可以通过PCB背面的切换开关选择“性能”和“静音”模式。
IO接口方面,华硕TUF RTX 4090 O24G GAMING显卡配置了2个HDMI 2.1a和3个DP1.4a视频输出接口,能够满足不同用户的高清显示输出需求,也方便玩家组建多屏显示平台。
供电接口为全新的16针PCIe Gen5供电接口,最高可提供600W的额外供电。
随显卡附赠的是一根4转1供电转接线,而非RTX 30系列显卡的3转1供电转接线,实现最高600W的额外供电,为显卡持续高效运行提供稳定的动力。
TUF RTX 4090显卡拆解
华硕TUF RTX 4090 O24G GAMING显卡的PCB长度为22cm,相比显卡的散热模块和背板部分短了很多,各种电子元件非常密集的排布在PCB上,紧凑但井然有序。
RTX 4090采用的是一颗AD102-300-A1核心,由台积电4N工艺制成,面积的大小为608mm²,比上一代的GA102核心略小一些。
GPU核心周围排布了12颗来自美光的GDDR6X显存颗粒,单颗容量为2GB,总共12颗组成24GB的显存总容量。
华硕TUF RTX 4090 O24G GAMING显卡采用了18+4相的豪华供电设计方案,更是使用了军规级别的电容,让GPU核心的供电更加稳定、耐久,能够长时间维持高效运行状态。
散热鳍片采取2段式设计,由5根8mm和3根6mm直径的纯铜镀镍热管穿插相接,配合均热板可以将GPU核心和显存颗粒、供电模块产生的热量迅速传递到散热鳍片的各个角落,实现快速高效散热。
导风罩内侧还加设了金属强化框架,能够减少散热风扇转动时产生的震动,提高散热风扇的稳定性,同时也更进一步提升了显卡的整体结构强度。
基准性能测试
测试平台简介
GPU-Z信息一览
这次NVIDIA的公版RTX 4090显卡设计比较激进,核心频率直接2235/2520MHz起步,几乎没有给各家AIC厂商预留多少超频空间,我们收到的这款华硕TUF RTX 4090 O24G GAMING显卡则是将Boost核心频率进一步提升了45MHz达到2565MHz,而且无论是性能模式还是静音模式,显卡的核心频率均为2235/2565MHz,显卡功耗为450W。
在面向4K分辨率的DX11测试项目3DMark Fire Strike Ultra中,华硕TUF RTX 4090 O24G GAMING显卡得分为25123。
在面向2K分辨率的DX11测试项目3DMark Fire Strike Extreme中,华硕TUF RTX 4090 O24G GAMING显卡得分为46294。在面向4K分辨率的DX12测试项目3DMark Time Spy Extreme中,华硕TUF RTX 4090 O24G GAMING显卡得分为19473。
在面向2K分辨率的DX12测试项目3DMark Time Spy中,华硕TUF RTX 4090 O24G GAMING显卡得分为36407。
在光追测试项目3DMark Port Royal中,华硕TUF RTX 4090 O24G GAMING显卡得分为25860。
在光追测试项目3DMark DirectX光线追踪功能测试中,华硕TUF RTX 4090 O24G GAMING显卡运行帧数为138.22FPS。
在3DMark NVIDIA DLSS功能测试的DLSS2测试项目中,华硕TUF RTX 4090 O24G GAMING显卡在关闭DLSS下运行帧数为119.82FPS,开启DLSS后运行帧数为241.39FPS。
在3DMark的Beta测试版中加入了全新的DLSS3测试项目,默认为4K分辨率、DLSS模式Performance,华硕TUF RTX 4090 O24G GAMING显卡在关闭DLSS下运行帧数为57.6FPS,开启DLSS后运行帧数为173.9FPS。
光追游戏《边境》实测
边境
4K分辨率游戏帧数实测
2K分辨率游戏帧数实测
光追游戏《地铁:离去增强版》实测
地铁:离去增强版
4K分辨率游戏帧数实测
2K分辨率游戏帧数实测
光追游戏《古墓丽影:暗影》实测
古墓丽影:暗影
4K分辨率游戏帧数实测
2K分辨率游戏帧数实测
光追游戏《光明记忆:无限》实测
光明记忆:无限
4K分辨率游戏帧数实测
2K分辨率游戏帧数实测
光追游戏《杀手3》实测
杀手3
4K分辨率游戏帧数实测
2K分辨率游戏帧数实测
光追游戏《神殒》实测
神陨
4K分辨率游戏帧数实测
2K分辨率游戏帧数实测
DLSS3游戏《赛博朋克2077》实测
赛博朋克2077
4K分辨率游戏帧数实测
DLSS3测试版质量模式4K分辨实测
2K分辨率游戏帧数实测
DLSS3测试版质量模式2K分辨实测
《赛博朋克2077》开启DLSS3模式后提升也十分显著,不过4K分辨率下开启性能模式未能达到NVIDIA官方说明中的100fps以上,也有说法是beta测试程序原有的机制未能将插入的帧数部分显示出来,这是一种全新的即时渲染方式,和以往都不同。可以肯定的是这个游戏的DLSS3功能还属于内部测试阶段,还存在不完善因素,需要等到DLSS3版本正式更新后才能展示出真正成绩。
DLSS3游戏《F1 22》实测
F1 22
4K分辨率游戏帧数实测
DLSS3测试版质量模式4K分辨实测
2K分辨率游戏帧数实测
DLSS3测试版质量模式2K分辨实测
2K分辨率下本身帧率已经很高,DLSS3质量模式提升明显,但性能模式进步不大,可能建模速率已到CPU性能上限,4K测试似乎佐证了这一点。
结语
4K分辨率游戏帧数实测
2K分辨率游戏帧数实测
使用NVIDIA提供的测试码,让我们可以提前玩到DLSS3版本的《赛博朋克2077》和《F1 22》,可能是由于测试版本优化不佳的原因,两款游戏的DLSS3测试版本帧数成绩表现并不如人意,在4K分辨率下游戏帧数表现远低于现在的DLSS2正式版本,所以DLSS3版本的测试成绩仅供大家参考,实际游戏体验应以目前的DLSS2正式版本成绩为准。
从测试结果来看,除了不支持DLSS技术的《杀手3》之外,其它参测游戏即便是在4K分辨率下开启最高光追特效,RTX 4090显卡也能轻松保持60FPS以上的游戏平均帧数表现,2K分辨率更是游刃有余,即便是《杀手3》也能达到90FPS以上的游戏平均帧数成绩。
待机状态
在待机状态下,华硕TUF RTX 4090 O24G GAMING显卡的整体功耗约为8W,三个散热风扇均处于停转状态,GPU核心温度显示为30.7℃,Hot Spot温度为39.3℃。
静音模式
在静音模式下运行Furmark对显卡进行单独烤机测试,20分钟后GPU核心温度稳定在了69℃,Hot Spot温度为78.9℃,此时三个散热风扇的转速均为1200RPM,几乎听不到风扇噪音。
性能模式
开启性能模式运行Furmark对显卡进行单独烤机测试,20分钟后GPU核心温度维持在了65摄氏度,相比静音模式低了4℃,Hot Spot温度为76℃,相比静音模式低了近3℃,而三个散热风扇的转速则提升到了1655RPM左右,仅能听到细微的风扇转动声音,噪音环境依然非常安静。
结语:凭借着新一代Ada Lovelace架构和第三代RT单元,RTX 4090显卡实现了光追性能的巨大提升,理论光追性能相比RTX 3090Ti提升幅度超过了一倍(DXR理论性能提升幅度达133%),实际应用性能提升幅度也能达到70%左右,这让玩家在面对4K分辨率光追游戏时不用再唯唯诺诺,有了可以正面硬刚的资格,不过这份资格也并不是所有玩家都可以享受到的,12999元的首发价格同样会让大部分普通游戏玩家望而却步,但回想一下一年前2、3万块钱都买不到的RTX 3090,又会觉得RTX 4090只卖12999真的很便宜——当然前提是没有“黄牛”炒作RTX 4090显卡的价格。
继公版RTX 4090显卡之后,华硕也即将上架自家的非公显卡产品,其中就包括了主打品质的TUF GAMING系列的TUF RTX 4090 O24G GAMING显卡,在NVIDIA已经极力压榨RTX 4090性能的前提下,依靠科学的工程设计和扎实的做工用料,进一步提升GPU核心频率,让TUF RTX 4090 O24G GAMING显卡的性能再上一个台阶,全面超越公版RTX 4090显卡,将会成为游戏玩家畅玩4K光追游戏的最佳利器。
游民星空现已上线RTX4090抽奖,现在进入游民星空,即可一键白嫖价值14999的七彩虹 RTX4090 Vulcan!