财经库-做有影响力的财经网站

英伟达GeForceRTX4090首发评测:AI加持DLSS3帧数暴涨4

时间:2022-10-12 13:34    栏目:消费    来源:财经库
英伟达GeForceRTX4090首发评测:AI加持DLSS3帧数暴涨4

每次NVIDIA发布新一代显卡,总会在玩家中引起轰动。一方面是核心性能的提升趋于突飞猛进,更重要的是英伟达每次都带来一些令人惊艳的新技术。今年的RTX 40系列显卡首次引入了DLSS 3技术,用AI插帧最多可以增加4倍帧数。这无疑将是GPU发展史上的一次革命。?

It之家提前收到了RTX 40系列GPU旗舰——GeForce RTX 4090方正版。在本次测试中,我们将填写所有配置,以了解当今消费电脑的极限在哪里。具体配置如下:

设计:一只冰冷的银黑色野兽。

当我第一次得到它时,GeForce RTX 4090给人一种充满力量的感觉。以前高端显卡一般都是三风扇三插槽,而GeForce RTX 4090由于功耗和散热的提升,变成了3.5插槽的巨卡。这意味着你在安装的时候需要准备一个更大的机箱。同时由于重量增加,最好配合显卡支架使用。?

GeForce RTX4090的TDP功耗提升至450W。为了承载更高的功耗,电源接口改为16 Pin。目前市面上支持16针的电源并不多。幸运的是,封装中包含四条8引脚至16引脚跳线。所以也建议你选择至少850W的全模块电源。?

GeForce RTX4090的整体造型继承了与RTX 30系列公有GPU几乎相同的设计。在银黑相间的装甲中,有密密麻麻的金属冷却装甲和两个巨大的风扇。一前一后形成垂直空气导管。?

顶部的GEFORCE RTX标志点亮时也会发光。?

由于GeForce RTX 4090显卡体积比较大,显卡侧面有一个显卡支架的螺丝孔,打开盖板就可以安装显卡支架。?

Geforcertx4090依然是标准的三个DP 1.4+一个HDMI 2.1接口,可以支持最高分辨率8K的显示。?

技术分析:核心规模暴涨,助力AI飞跃

GeForce RTX40系列的前三款分别是GeForce RTX 4090、GeForce RTX 4080 16GB、GeForce RTX 4080 12GB。我们手中的GeForce RTX 4090基于目前最高端的AD102内核。有16,384个CUDA核心,512个张量核心,128个光跟踪核心,512个纹理单元和176个ROP单元,比上一代RTX 3090核心大了一半以上。后续应该会有真正的旗舰RTX 4090Ti,解锁所有GPC单元。?

?GeForce RTX 4090的核心频率为2230-2520MHz,相比上一代也提升了一半以上。内存还是384位24GB GDDR6X,但是带宽提升到1TB/s,TDP 450 w,达到RTX 3090 Ti的档次,比RTX 3090多100W。猜测是因为核心规模和频率都在飙升,所以功耗不得不上调。?

GeForce RTX4090的架构也有很大变化。它已经升级到最新的英伟达阿达·洛芙莱斯架构。它是基于TSMC 4N NVIDIA定制工艺构建的,因此它实现了高达2倍的性能功耗比。多处理器的着色能力高达83 TFLOPS,吞吐量是上一代的两倍。第三代RT核的有效射线追踪计算能力达到191 TFLOPS,是上一代的2.8倍。第四代Tensor Cores增加了FP8引擎,张量处理性能高达1.32 petaflops,比上一代提升了5倍。为SER光线追踪带来高达3倍的性能提升,整体游戏性能提升高达25%。?

这些数据可能是抽象的。体现表现的功能,新架构带来了很多新的功能:由于Ada光流加速器的引入,DLSS 3可以预测场景中帧与帧之间的运动变化,实现AI插帧,在保持图像质量的同时提高帧率。同时,双AV1编码器的应用不仅可以缩短视频导出时间,还具有更好的图像质量。总之游戏制作都适合。?

以上是对GeForce RTX 4090的硬件规格和架构的分析。至于大家最关心的DLSS 3技术,我们会在稍后的游戏测试环节给大家详细讲解。?

理论:跑分几乎翻倍,提升惊人。

这样的旗舰在理论性能上会有多大的进步?接下来,我们进行理论测试。首先,我们单独烤甜甜圈。烘烤15分钟后,核心温度稳定在67.6℃左右,功耗稳定在443W左右,满足450W的TDP。风扇远未满载。看来这散热还是绰绰有余的,甚至还有不少超频空间。然而,这也意味着GeForce RTX 4090真的很耗电。如果是配i7/i9的处理器,还是老老实实用1000W以上的电源比较好。?

接下来,进行3DMark压力测试。这个测试可以检测显卡在连续运行下性能是否下降。一般97%以上的显卡是合格的。GeForce RTX 4090的实测分数为98.9%,几乎没有降频,完美通过测试。?

在3DMark TimeSpy DX12测试中,GeForce RTX 4090显卡的成绩达到了34725。作为对比,GeForce RTX 3090的分数是18981,RTX 3090Ti的分数是21862。也就是说GeForce RTX 4090的提升达到了82.95%,太可怕了。?

在3DMark Fire Strike DX11测试中,GeForce RTX 4090显卡的成绩达到了75013。作为对比,GeForce RTX 3090的分数是46045,GeForce RTX 3090Ti的分数是52630。涨幅也达到了62.91%。这个分数意味着所有游戏都可以在4K分辨率下流畅运行,即使是轻追游戏和VR游戏也能满足高刷新率的需求。?

在3DMark Portal Royal光学跟踪测试中,GeForce RTX 4090获得了25080分,比光栅性能有了更大的提升。与GeForce RTX 3090相比,它几乎翻了一倍。在过去,GeForce RTX 3090是一款在2K分辨率下可以流畅体验的轻追游戏,但RTX 4090可以在4K分辨率下再次流畅播放。?

RTX 4090在理论跑分上的成绩绝对令人震惊。我们做了一个GPU物理成绩对比表。在所有项目中,RTX 4090比上一代旗舰卡几乎提升了一倍。

?DLSS 3详解:AI助力游戏,帧数暴涨4倍。

虽然理论性能提升了近80%,但NVIDIA并不满足于此。发布会上最重要的技术升级是DLSS 3技术。DLSS 3是一个人工智能驱动的性能倍增器,由新的第四代张量核心和GeForce RTX 40系列GPU的新光流加速器驱动。它是英伟达广受好评的深度学习超级采样技术的最新版本,具有开创性的光学多帧生成功能,将开启英伟达RTX神经网络渲染游戏和应用的新时代。?

基于英伟达阿达·洛芙莱斯架构的光流加速器可以分析连续两幅游戏图像,并逐帧计算物体和元素的运动矢量数据,无需传统的游戏引擎建模。多帧生成模型同时获得游戏引擎中的运动矢量和光流数据,大大降低了AI在渲染粒子、反射、阴影、光照等元素时的视觉异常。?

简单来说,过去的DLSS 2通过渲染低分辨率的图像来提高图像质量和帧数,然后将AI放大到高分辨率。在兼容DLSS 2的基础上,新DLSS 3还增加了新的帧生成功能,可以在两个真实帧之间插入一个由AI计算的新帧,使帧数翻倍。结合《DLSS 2》的超分辨率功能,AI可以重构高达7/8的显示像素,游戏性能最高可以比没有DLSS时提升4倍!?

如果没有证据,我们直接进入测试环节。3DMark的最新版本已根据DLSS 3的基准进行了调整。我们将GeForce RTX 4090的测试结果与《DLSS 2》的控制变量进行对比,可以直观的看出其中的差异。在实测的《DLSS 2》模式下,平均帧数为134,比没有《DLSS 2》的情况高出一倍多。?

但是如果我们开启最新的DLSS 3技术,GeForce RTX 4090显卡的帧数直接就达到了平均165帧,比没有DLSS的时候提高了3倍多。这个提升还是比较明显的。?

目前,《DLSS 3》已经得到了全球众多领先游戏开发商的支持,比如:

●超人类:抢先体验版将于10月12日13:00发售,支持DLSS 3。

●生死轮回将于10月12日发布更新版本,支持DLSS 3。

●《迎冷水》和《福听云》:将于10月13日发布新的图形显示,支持DLSS 3。

●《微软飞行模拟器》:测试版将于10月17日面向Xbox Insider计划会员推出,支持DLSS 3。

●瘟疫传说:安魂曲:将于10月18日上映,支持《DLSS 3》。

此外,超过35款游戏和应用已经宣布将很快支持这项技术。只要适应DLSS 3,向后兼容DLSS 2就很容易开发,所以后续肯定会有越来越多的开发者加入DLSS阵营。我们选择了赛博朋克2077,对冷水和虚幻引擎5:天琴座,这已经适应了DLSS 3,并演示测试GeForce RTX 4090。此外,我们还将测试一个演示版《Unity引擎的敌人》。?

首先,因为最近爆红的《触发社》同名动画《赛博朋克2077》,我们在4K最高品质超光追越驱动模式下运行了自己的基准,得到了以下数据。从这些数据中,我们可以得出三个结论:

1.GeForce RTX 4090的物理性能足够强大,可以在原生4K分辨率下运行超轻追逐赛博朋克2077。?

2.DLSS 3的改进非常明显。在全部处于超性能档位的前提下,DLSS 3的帧数比DLSS 2增加了50%,比没有DLSS的DLSS增加了2.5倍。?

3.由于帧数的增加,您可以在实际播放中以DLSS 3质量文件驾驶时体验到流畅度的提高和更好的画质。?

那么《DLSS 3》会对画质产生严重影响吗?我们使用NVIDIA ICAT工具进行图片对比,可以看到左右画质差异并不明显。可以说,DLSS 3技术真的可以让我们白白“捡拾”近一倍的帧数。?

左DLSS关闭,右DLSS 3平衡

光线追踪也是NVIDIA带来的革命性功能。它可以在虚拟世界中模拟真实的全景光线和反射。比如下图,雨后湿漉漉的地面最能展现光追赛博朋克的魅力。如果你仔细观察水坑,差别会很明显。如果不开追光,只会有一个模糊的投影,但是开了之后会产生一个生动的倒影。

左关右开。

在国产武侠网游《兑冷水》和《伏听云》的更新中,也提供了RTX射线追踪和DLSS 3个选项。从下面的数据可以看出,DLSS 3在《迎冷水》中的表现甚至比《赛博朋克2077》还要出彩。DLSS不开的时候几乎无法播放,但是DLSS 3开了之后帧率提升了近5倍。与同档的DLSS 2相比,也提高了近65%。?

在图像质量方面,我们选择了一个场景的细节,我们可以看到DLSS关闭和DLSS平衡之间的画面差距非常小。甚至在某些地方,DLSS开启后的画质更清晰,这就是AI技术的魅力。?

左DLSS关闭,右DLSS 3平衡

接下来是demo《??·莱拉用虚幻5引擎做的游戏。虚幻5引擎提供了对RTX光线追踪、DLSS 3和英伟达反射的完整支持,因此未来会有大量基于虚幻5引擎的3A大作推出。?

?DLSS 3在天琴座的表现也符合预期。DLSS 3开启后,帧率提升近1.7倍。与同档的DLSS 2相比,也提高了近20%。?

除了虚幻引擎,Unity引擎还提供了对RTX光线追踪,DLSS 3和英伟达反射的完整支持。最后,我们测试了一个具有爆炸图像质量的演示“团结:敌人”。这个Demo没有那么多档位可以选择,只有开关可以调节。在GeForce RTX 4090中打开DLSS 3后,帧数跃升了近2.5倍,4K渲染如丝般流畅。?

在服装质感和头发渲染方面,这是AI很难做到的,打开DLSS和关闭DLSS在画质上几乎没有区别。可以说,在《DLSS 3》AI的帮助下,4K追光游戏终将普及,成为各种游戏的标配。?

左DLSS关闭,右DLSS 3平衡

所以DLSS 3号技术是完美的?当然不是。《DLSS 3》的精髓在于AI生成全新的框架。帧生成的一个副作用是延迟增加。毕竟,我们的鼠标会对我们看到的帧进行反馈,而AI会添加额外的帧。这种延迟对竞技游戏的影响很大。因此,在开启DLSS 3的帧生成功能时,会强制开启NVIDIA Reflex,以尽量减少帧生成带来的渲染延迟。?

游戏实测:拿所有4K大作,挑战8K玩。

除了支持《DLSS 3》这款大作,IT之家还为大家测试了几款主流游戏。GeForce RTX 4090将以4K分辨率的最高图像质量进行测试。在新推出的《守望先锋》《归来》中,帧数甚至可以跑到600帧的上限。即使是激战,也能保持在500帧左右,电竞体验极佳。?

而且这款游戏还支持NVIDIA Reflex低延迟,使得CPU在完成上一帧之前就开始向GPU提交渲染作业,从而大大减少甚至消除渲染队列,使得响应时间更快,瞄准精度更高。?

在《古墓丽影:暗影》中,实测基准可以在4K分辨率下最高画质下运行到176帧,已经可以满足4K144Hz显示的要求。?

这个游戏也有DLSS支持,但是版本比较老,所以效果肯定没有DLSS 3那么明显。测得的GeForce RTX 4090平均提高到185帧。?

最后,我们用追光3A测试了一款大作《控制》。4K的最高画质赶不上DLSS,但我们勉强能流畅地玩。在GeForce RTX 4090中打开DLSS后,帧数直接翻倍。这种体验相当优秀。?

一般来说,GeForce RTX 4090在4K分辨率下可以满足高帧数3A的所有要求。如此强大的性能,加上DLSS 3的加持,连8K的游戏都可以挑战,24G的巨大内存让它从头到尾都没有爆发过。如果你有一个4K144Hz的显示器,那么RTX 4090的显卡将是最好的选择。?

创造力:消费者生产力的巅峰

以GeForce RTX 4090的水平,绝对不只是玩游戏,还有创意制作和深度学习。GeForce RTX 4090也是NVIDIA Studio加速的GPU。目前有超过75个创意应用可以调用AI计算能力,大幅提高工作效率。?

在建模和渲染软件中,GeForce RTX 4090可以使用CUDA为其工作提供硬件加速。目前几乎所有的建模软件都会对NVIDIA的GPU进行优化,因此可以实现效率、稳定性和兼容性的共存。例如,在常用的渲染工具V-Ray中,通过RTX加速的光线跟踪可以实现高性能的最终帧渲染。借助AI的降噪功能,GPU可以进一步加速交互渲染。?

V-Ray Benchmark开启历史。如果RCERTX 4090 GPU CUDA加速,成绩达到4221分,创下历史纪录。?

得益于光线追踪性能的提升,GeForce RTX 4090在V-Ray GPU RTX中的得分也提升到了5840,足以应对实时光线追踪的繁重渲染。?

最后,让我们运行另一个渲染软件Octane,它可以通过RTX加速光线追踪和OptiX降噪与AI实现快速交互渲染。根据GeForce RTX 4090的最终测试结果,其渲染能力相当于最多26个GTX 980同时工作,GPU的提升真是日新月异。?

在视频的后期,GeForce RTX 4090配备了第八代NVIDIA NVENC编码器,支持AV1编码和双编码器。AV1是下一代视频编码技术,在占用相同空间的情况下,可以提供更快的视频编码和更高质量的流媒体传输性能。?

?NVIDIA与许多行业合作伙伴密切合作,今天的主流多媒体应用程序可以支持AV1。目前国内专业版clipping已经支持NVIDIA AV1视频编码器加速。OBS直播软件还支持NVENC的AV1代码录制,希望尽快适应AV1代码的直播,从而大大节省直播带宽。?

常用的视频色彩编辑软件DaVinci也提供了对AV1编码的支持。作为一个免费开源的编码,后面会有越来越多的主流软件加入进来。?

IT之家为大家测试了达芬奇的PugetBench。基于NVIDIA CUDA技术的GPU加速特效可以实现更快的实时视频编辑和帧渲染,使用NVIDIA编码的输出速度最高可提升5倍。GeForce RTX 4090最终成绩可以达到2610,编辑8K视频不会卡顿,也不需要打开代理实时播放。?

此外,英伟达还为RTX GPU提供了英伟达广播神器。通过人工智能技术,实现音频降噪、绿屏键控、人像对焦等实用效果。?

现在,我用一个简单的USB摄像头和麦克风在家里直播。即使这样的电脑只有一个摄像头,在RTX GPU的帮助下,也可以在各种应用程序中使用NVIDIA Broadcast应用程序来实现效果。?

总结:AI是我们这一代的工业革命。

虽然测试时间很紧,但笔者还是被GeForce RTX 4090震撼到了。一方面,其80%左右的光栅性能提升确实巨大,似乎在自豪地宣告后摩尔定律时代的GPU性能突破。另一方面,我感觉英伟达把AI技术融入到了GPU的方方面面,甚至突破了显卡的物理规律。通过DLSS 3的AI技术和全景光线追踪,给游戏领域带来了数倍的提升。对于广大开发者来说,如何充分利用RTX 40系列GPU非凡的AI计算能力,决定了我们如何书写下一代。?

价格方面,GeForce RTX 4090方正版建议零售价为12999元。与其巨大的性能提升相比,这个价格并不算贵。如果你是一个想要体验4K144Hz的游戏发烧友,或者是一个生活在GPU上的专业企业用户,那么RTX 4090绝对是目前唯一的顶级选择。但如果你是普通玩家,就不需要用这么高端的GPU,用英伟达阿达·洛芙莱斯架构的高端机型,或者现在价格已经稳定下来的RTX 30系列机型。

JD.COM NVIDIA GeForce RTX 4090 Fe 12999元直接链接

值得一提的是,此次NVIDIA将限量推出GeForce RTX 4090 FE版,将于北京时间10月12日晚9点在JD.COM首发,旨在为热爱FE版设计的发烧玩家带来无与伦比的体验。届时,玩家可以从顶级显卡供应商那里选择NVIDIA FE版和RTX 4090 GPU标准版和超频版。此外,非公RTX 4090显卡已由英伟达授权合作伙伴华硕、多彩、更生、银河、技嘉、钟颖、魏星、索泰推出,也于北京时间10月12日晚9点在各大平台同步开售。

点击这里进入:RTX 4090公共版购买页面。

发布者:沐瑶   
推荐