
自 SLI 推出以来,SLI 架构并没有多大的变化,直至 Pascal 年代才进行一次重要的升级。这次升级不但提升工作时脉(从 400MHz 增至 650MHz),而且改用双 MIO 架构以提升频宽,但 Pascal 并没有一刀切放弃对旧 SLI Bridge 的支援,可以考虑在降低效能的情况下沿用旧 SLI Bridge,因此整个 SLI 架构并未出现重大变化。
来自超级电脑的 NVLink 技术NVLink 技术推出于 2014 年,主要供多 Tesla P100 协同运算之用,也可用于连接 IBM Power 8+/9 CPU,打造超级电脑方案。NVLink 架构类似 PCI-E 採用点对点结构、串列传输,lanes 数目定于 x8,略少于 PCI-E 主流的x16 lanes。
不过 NVLink 的速度极高,1.0 版已有 20GT/s,2.0 版更有 25GT/s,明显比 PCI-E 3.0 的 8GT/s、PCI-E 4.0 的16GT/s 高,使总频宽分别达到 20GB/s(1.0)及 25GB/s(2.0),不下于 PCI-E 3.0 的 16GB/s。

NVIDIA SLI 技术演进图。第一代 SLI Bridge 以 Full HD Gaming 为主,SLI-HB Bridge 开始提供 4K@60fps Gaming,而新一代 NVLink 更以 8K Surround Gaming 为目标。
RTX NVLink Bridge在 RTX NVLink Bridge 上,NVIDIA 赋予它 NVLink 2.0 技术,工作在 25GT/s。在每片 RTX 2080/2080 Ti 显示卡上,顶部均有一条 x8 lanes NVLink 插槽,它在 RTX 2080 为单组 NVLink,可用频宽是 25GT/s×2(双工)x8/8 = 50GB/s。若果换了是 RTX 2080 Ti,因为 TU102 核心运算能力较高的关係,改为两组 NVLink,可用频宽增加 1 倍至 100GB/s。

三代 SLI 同堂的画面。中间是 SLI Bridge(第一代)、左方是 SLI-HB Bridge(第二代)及右方 RTX NVLink Bridge(第三代)。
3-Slot 宽度成标準上一代 SLI-HB Bridge 因为是 SLI Bridge 的改良版,基本架构并没有太大的变化,仍有 2-way、3-way 及 4-way不同的版本。考虑到 Turing 核心运算能力较高关係,NVIDIA RTX NVLink Bridge 设计仅提供 3-way 及 4-way 版本,以确保显示卡之间拥有足够的散热空间。不过这设计与一众 Intel Z390/Z370 主机板的 2-way SLI 布局不同,产生兼容问题。
另外,RTX NVLink Bridge 的官方售价也从 SLI-HB Bridge 的US$39.99 猛增至 US$79.99。而自 Pascal 开始,NVIDIA 拒绝公开 3-way 及 4-way SLI功能,在 Turing 核心也不例外。

TITAN Xp、GTX 1080 Ti、GTX 1080、GTX 1070的SLI-HB Bridge 拥有 2 Slot、3 Slot、4 Slot 版本。

RTX NVLink Bridge 官方仅有 3-Slot 及 4-Slot 版本。
SLI-HB Bridge 与 RTX NVLink Bridge 比较拥有 ROG 血统的 ASUS ROG-NVLink 主要为配合旗下的 RTX 2080/2080 Ti 显示卡而设计。此卡加入多项 Gamers 喜欢的功能,如镜面设计、ROG 之眼 LED,以及 Aura Sync RGB 同步特效功能等等。
ASUS ROG-NVLINK-3 属于ROG 信仰的产物。
Connectors 之间的阔度只有 60mm, 兼容主流 2-Slot SLI 主机板。
不过,最令笔者印象深刻的,是 ASUS 针对官方设计的不足,在 3-Slot 版本支援 2-Slot SLI 主机板(60mm 宽度),也就是主流 Intel Z390/Z370 主机板两条 PCI-E x16插槽之间的空间。至于 4-Slot 版本则支援 3-Slot SLI 主机板(80mm),符合 NVIDIA RTX SLI 的要求。
售价:HK$899

可选「Maximize 3D Performance」或 Span displays with Surround(需使用多台显示器)。

SLI Rendering Mode 部分没有改变。
挑战 1+1>2实测 RTX 2080/2080 Ti NVLink SLI
NVIDIA曾经表示,每代产品在 SLI 后效能提升水平均有所提升,另一方面则强调新一代游戏在 SLI(尤其是 3-way 及 4-way SL)优化的困难。对于 RTX 2080/2080 Ti SLI,NVIDIA 并不强调其效能提升多少,但表示 NVLink RTX 2080 的应用在于 5K 75fps+、4K 144Hz Surround 或 8K Gaming。至于最高级的 NVLink RTX 2080 Ti 会以 8K Surround 为主。笔者没有多台 4K 显示器,决定先以 4K Gaming 测试为主。
3D Mark 测试是最能发挥 SLI 性能的测试。在《3D Mark Spy Time》测试中,RTX 2080 SLI 及 RTX 2080 Ti SLI 的组合分别取得 73% 及 66.44% 的增长。如果单看 Graphics Score 的部分,这一幅度更分别达到 92.33% 及 88.81%,十分可观。然而在游戏测试的部分,明显驱动程式未能作出优化,除了《Rise of the Tomb Raider》外,其余游戏只有少幅度增长,甚至不升反跌。
2080 SLI 表现最为耀眼原本以为,RTX 2080 Ti SLI 因为有两组 NVLink 的关係,表现应该较单组 NVLink 的 RTX 2080 SLI 好,可事实上 RTX 2080 SLI 效能增长较好。笔者认为,一部分原因是现在的驱动程式优化不足,未能发挥 RTX NVLink SLI 的威力;另一方面是 RTX 2080 Ti 本身运算能力较高,都是一大因素。此外,两张 RTX 2080 Ti 一起工作时发热量较高,不用特别散热时「裸跑」GPU 达 85℃,也有可能影响到效能。
Z390 NVLink SLI 测试除了 AMD X399 平台外,笔者也测试了主流的 Intel Z390 平台,看看在 x8+x8 SLI 组合下的性能。由于测试时刚好手上没有 RTX 2080 显示卡,仅能测试 RTX 2080 Ti 的组合。这部分的测试主要改用 Intel Core i7-8700K(6C/12T 3.7GHz Base/4.7GHz Turbo)CPU、ASUS ROG MAXIMUS XI FORMULA 主机板及 2×16GB Corsair DDR4-2666 CMK16GX4M1A2666C16@XMP 记忆体。
早前有报道指,x8 会影响 RTX 2080/2080 Ti 的效能,这次改用 Z390的 x8+x8 组合,是否也会对效能产生影响呢?就测试结果来看,RTX 2080 Ti SLI 效能增长似乎不因为改用 x8+x8 而出现明显下降,可见 x16+16 组合对于 RTX 2080 Ti 并非必要,出于成本的考虑,Z390 主机板加 Intel 9/8 代 Core CPU 似乎是更高性价比的 RTX NVLink SLI 平台。
Ray-Tracing 会是用武之地?总的来说,RTX NVLink SLI 并没有表现出应有效能。笔者认同新技术优化需要,这也无可厚非,另来是 Ray-Tracing 等高阶功能尚未开放。随着新一代 Ray-Tracing 游戏陆续上市、驱动程式提供更多的优化,相信 RTX NVLink SLI 会表现出应有的效能。