dx10主板 dx10( 二 )


文章插图
明白了这一点,再来看这次的RTX 4090 。没错,其流处理器数量虽然“仅仅”比上代提升了56%,但一方面大幅提升的主频让RTX 4090的单精度浮点性能,相比上代提升了超过100%;另一方面,在“传统”的纹理和多边形生成性能上,RTX 4090也进行了久违的大幅度增强,这就意味着哪怕是在古早游戏、或是DX9、DX10时代的老游戏里,也有望带来翻倍的帧率表现 。


这还没完,在RTX 4090上,NVIDIA也终于“从善如流”地使用了当前流行的超大L2缓存设计,而大缓存实际上会进一步增大显存的等效带宽 。因此RTX 4090在实际使用中的显存吞吐量性能,其实是有望大幅领先于RTX 3090的,决不会只有表面上看起来的那么一点差异 。

dx10主板 dx10

文章插图
这也就意味着,相比于RTX 20系专注“光追”、RTX 30系专注新游戏的设计思路,RTX 4090的基础设计思路可以说是实现了全方位的、无论是最新3A大作、还是早前的DX10甚至DX9游戏,都能带来数倍帧率提升的规格进步 。很显然,这让它看起来非常地“有诚意”,也着实令我们对它有了更高的期待 。
【【【功能解析:多项新技术加持,重点在于效率提升】】】
讲完了RTX 4090在基础架构上的设计思路改变,接下来我们来看看它此次在功能层面带来的一些新玩意 。
dx10主板 dx10

文章插图
首先,RTX 4090不只是重新重视起最基础的多边形、纹理生成性能,将自身基本的3D绘图能力提升了超过100% 。还成为了业界首个支持“着色器执行重排序”功能的GPU 。在NVIDIA方面公布的信息显示,这项功能的重要性几乎可以等同于CPU上的乱序执行技术,特别是在现代光线、场景、材质极为复杂的大型游戏中,光是这一个功能就能让光线追踪的着色效率提升100%、或是让游戏帧率提高1/4 。
dx10主板 dx10

文章插图
其次,RTX 4090的RT Core(光追单元)也进化到了第三代架构,内部增加了Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎两个新的功能模块 。其中,OMM引擎专为树叶、颗粒和围栏等镂空材质的光追计算进行了专门优化,而DMM引擎则专门负责构建光线追踪边界体积层次结构 。其计算速度相比过去的设计提高了9倍,同时显存占用更是仅有前代的1/20,大幅提高了显卡在应对复杂场景光追游戏时的计算效率 。换句话来说,与上代的RTX 20、RTX 30系相比,RTX 4090在开启光追后的帧率损失将会更少,特别是在本身画质就很高的游戏里,更是有助于玩家享受“满配视觉体验” 。
dx10主板 dx10

文章插图
而在AI计算能力上,大家都知道RTX 4090的ADA Lovelace架构脱胎于专业计算卡上的Hopper架构 。自然这也就意味着,它的Tensor Core也采用了Hopper同款的第四代架构,拥有4倍于前代的数据吞吐量 。
dx10主板 dx10

文章插图
最后,在第四代Tensor Core以及新架构所独有的“光流加速器”的加持下,NVIDIA为RTX 40系带来了全新的DLSS 3深度学习抗锯齿功能 。事实上,此前DLSS本质上是GPU先进行低分辨率渲染,然后再由Tensor Core进行AI超分画面缩放,从而在降低显卡实际负载、提升游戏帧率的前提下,让画面看不出太多的损失 。而DLSS 3如今已不只是对单帧画面进行无损超分放大、AI填充细节这么简单了,它甚至可以让RTX 40系显卡直接生成完整的、具有实际画面内容的中间帧 。如此一来,这也就意味着RTX4090此次在适配了DLSS 3的游戏里,几乎可以“凭空”提升帧率到原本的3-4倍之多 。对于特别重视帧率的玩家(比如FPS、竞速游戏爱好者)来说,这个功能显然值得感到兴奋 。
【【【外观鉴赏:全金属巨型散热器,无光污染是优势】】】
讲了这么多技术上的、功能上的话题,相信大家已经等不及要进入实际的产品测试环节了 。
dx10主板 dx10

文章插图
这就是我们三易生活此次拿到的评测对象,影驰RTX 4090金属大师OC 。不得不说,从图片上大家可能感受还不是太深,但实际上这个几乎有半米高的包装盒从一开始,就给了我们极大的震撼 。
dx10主板 dx10

文章插图
拿掉封套、打开又大又厚的包装盒,显卡本体被静电袋和厚实的防震棉所包裹着,除此之外还有一些附件也都放在了与显卡平行的显眼位置上 。很显然,它们也正是造成包装盒如此巨大的“元凶” 。

秒懂生活扩展阅读