您的位置:首页 > 数码 >

【天天热闻】英伟达“春晚”上菜!RTX 40系显卡发布

来源: 凤凰网 时间: 2022-09-21 15:51:36

原标题:英伟达“春晚”上菜!RTX 40系显卡发布、“雷神”超级计算机,再次刷新科技极限

又到换显卡的时候了——如果平台有货、你还有肾的话……

当地时间9月20日,英伟达在 GTC 显卡技术大会上,终于发布了万众期盼的 RTX 40 系列显卡。其中 4090 起步价就高达1599美 元(¥11200+)。


(资料图)

RTX 4090 渲染图 图片来源:英伟达

这个价格,难怪发布会后,网友恶搞的图就纷纷上线……

图片来源:LTT

除了 40 系列显卡之外,同场发布的,还有英伟达在图形计算架构、游戏开发、AI 加速、工业元宇宙、云计算、量子计算等方面的新产品、技术、最新进展。

它们包括(并不限于):

全新 GPU 架构 Ada Lovelace,安培 (Ampere) 架构的升级版,也是40系列显卡性能巨大提升的功臣;

RTX Remix,一个游戏 mod 开发工具,能够为几乎任何3D游戏添加光追效果

“核弹”H100 AI 加速 GPU,已经全面启动生产,即将发货;

“雷神”(Thor) 超级计算机,整合 Grace(CPU)、Ada(GPU)、 Hopper (AI加速计算)三大能力,适用汽车、医疗、工业等领域。以汽车为例,单机即可撑起整个自动驾驶系统+车机+车载娱乐系统;

Omniverse Cloud 服务,能够连接几乎所有主流大型3D工业/设计应用的云端基础设施(IaaS),让元宇宙开发可以在多端任何设备之间无缝工作;

Nemo LLM 系列,一个超大规模神经网络开发工具,能够显著加速大规模神经网络模型的训练、调优和推理等,包括面向自然语言、生物制药等多个场景的子服务。

其中,最新的 Ada Lovelace 架构,可以说是绝大多数新产品和技术突破的背后功臣。这是英伟达推出的全新 GPU 架构。主要特性为第三代 RT Core 光追核心,吞吐量为前代两倍;第四代 Tensor Core 张量核心,张量矩阵计算性能为前代两倍;Ada 架构的 CUDA 核心,显著提高AI 加速,以及3D图形计算的性能。

注:架构来自于“史上第一段电脑程序”的作者,英国数学家艾达·勒芙蕾丝伯爵夫人 图片来源:英伟达

接下来,一起来看这一届英伟达“春晚”,都给大家送上了哪些硬菜。

RTX 4090 & 4080

黄仁勋老板手里拿的这张是英伟达自己的 RTX 4090 Founders Edition(16GB),采用了以往创始人版本基本相同的外壳设计:

RTX 4090 图片来源:英伟达

目前从华硕、七彩虹等合作伙伴那边看到的首批 4090 和 4080 显卡设计普遍采用全尺寸、三风扇、3-slot 厚度:

ROG Strix RTX 4090 图片来源:华硕 ROG

Vulcan RTX 4090 图片来源:七彩虹

RTX 40 系列显卡是:

英伟达最新推出的Ada Lovelace 架构的第一款显卡,

采用了最新版 DLSS 3 深度学习超级采样技术、

着色器 Shader 执行重新排序 (SER) 技术、

Ada 光流加速器、

第八代英伟达双AV1编码器、

24GB GDDR6X 显存

在游戏性能方面,40 系列最大的性能提升来自于最新版 DLSS 3 技术。

DLSS (Deep Learning Super Sampling,深度学习超级采样)能够调取低分辨率的当前帧和高分辨率的上一帧,使用卷积神经网络 (CNN) 自动编码技术来提前预测出高分辨率的当前帧。

DLSS 3 的最大突破,在于在深度学习超分辨率技术的基础上,增加了光学多帧生成能力,并且集成了英伟达开发的高速低延迟向量计算技术 Reflex。

DLSS 3 采用的 CNN 自动编码器能够接受4个输入:当前帧、上一帧、Ada 光流加速器生成的光流场数据,以及运动矢量+深度等游戏引擎数据。

最厉害的地方在于 Ada 光流加速器:它能够分析两个连续帧,捕捉导粒子、光照、反射、阴影等不包含在游戏运动矢量引擎计算当中的信息,捕捉这些像素在两帧之间移动的方向和速度,从而独立计算出一个光流场。

Ada 光流场图示 图片来源:英伟达

结果就是,从这些数据输入当中,DLSS 3 能够精确计算并重建出当前帧的四分之三,外加下一帧的全部,总体重建了总显示像素的八分之七。这样能够极大地提高了游戏帧率和图形质量,进一步降低传统渲染方式对 GPU 和 CPU 造成的负载。

DLSS 3 技术图解 图片来源:英伟达

再加上全新的 Shader 执行重新排序 (SER) 技术,和 CPU 的乱序执行一样,是计算技术领域的重大创新,能够通过动态重新调度 shader 负载,更好地利用 GPU 内的各项资源,将光追性能提高三倍,提升25%左右的帧率

英伟达也找到波兰蠢驴合作开发了一个《赛博朋克2077》的光追过载模式,显示在 RTX 4090 显卡上打开 DLSS 3 之后图像输出延迟降低了一半多,帧率提升了四倍,总体性能提升约为4倍。这个模式回头也会推送给 PC 版玩家,在 40 系列显卡上可以打开。

标签: 超级计算机