您的位置首页  轻工机械  电气

NVIDIA GeForce RTX 3070 Ti Founders Edition测试解析

  • 来源:互联网
  • |
  • 2021-06-12
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

为何会有GeForce RTX 3070 Ti这款产品的面世?其实除了NVIDIA自身扩展、细化产品线的因素之外,更重要的原因还是在于NVIDIA在4500元级左右的中高端显卡市场上的RTX 30系产品空缺所迫。在这个价位的非光追游戏市场上,3899元首发价格的RTX 3070被RX 6800“死死地”吃住。但显然NVIDIA是不愿意看到这一幕的,于是顺着扩展产品线的势头,RTX 3070 Ti就这样来到了台前,并且挥剑直面RX 6800,开始了一场中高端显卡市场C位的抢夺战争。

相对RTX 3070规格小幅提升

GeForce RTX 3070 Ti到底是一款怎样的产品?让我们首先来看看它的“硬”实力。

作为新推出用于填补RTX 3070与RTX 3080之间产品缺漏的“急先锋”,GeForce RTX 3070 Ti从目前NVIDIA发布的产品进度来看,理论上它应该是用于取代前一代的对位产品RTX 2070 SUPER(图灵核心没有发布RTX 2070 Ti产品)。GeForce RTX 3070 Ti仍然是基于NVIDIA Ampere架构打造,和RTX 3070一样采用的是面对主流市场的GA104核心,具体代号为GA104-400-A1,以400的小序号命名,是不是也意味着RTX 3070 Ti是GA104核心的顶头大哥?而相比面向高端市场的GA102核心来说,GA104在规格上有一定幅度的缩减。

RTX 3070 Ti配置了48组NVIDIA Ampere架构的SM模块,理论CUDA核心数量为6144个。与早期发布的“兄弟”——GeForce RTX 3070相比,RTX 3070 Ti在SM模组数量上仅有2组的硬件规格优势,也就意味着RTX 3070 Ti相比RTX 3070在CUDA数量上多出256个。此外,192个第三代Tensor Core张量核心、48个第二代RT Core光追核心的配置也相对RTX 3070有小幅提升。

在显存方面,相对于RTX 3070,RTX 3070 Ti的显存从GDDR6升级到了GDDR6X,容量仍为8GB,但速率方面得益于GDDR6X的优势,从14Gbps提升到了19Gbps,不过位宽仍然限制为256-bit,这样其显存整体带宽为608GB/s,相比RTX 3070有不小提升。从规格的对比上来看,RTX 3070 Ti相对于RTX 3070来说只能算是有小幅度提升,根据经验判断的话,二者之间的性能差距大约会在5%左右。不过再加上GDDR6X显存的加持,估计二者之间的性能差距应该会提高到8%~10%上下。

再来看与RTX 3080的比较。坦白讲,这一代的3070 Ti与大哥RTX 3080的差别还是比较明显的。首先在SM模块上,48组对68组,RTX 3070 Ti相比RTX 3080在CUDA核心数量上落后了2560个,再加上4GB GDDR6X显存容量的差距,可以预估的是RTX 3070 Ti与RTX 3080之间的性能差距有可能达到20%~25%,甚至更高。

NVIDIA Ampere一脉相承

一脉相承,NVIDIA Ampere架构加持

纯技术向的东西总是让很多读者、玩家都会感觉枯燥,但是这些却又不能不讲。在RTX 3080 Ti首发评测的时候,我们也再次重提了NVIDIA Ampere架构GPU的核心技术特色。轮到RTX 3070 Ti深度测试解析之前,我们认为仍然有必要对其加深印象,因此我们也把NVIDIA Ampere架构的简单技术解析再次搬了过来,让我们一起来再次复习一下吧!

完整的NVIDIA Ampere架构GA102核心包含7个GPC,84组SM模块。后续包括RTX 3070系的GA104核心以及RTX 3060系的GA106核心皆是在GA102的基础上做相应减法得到。

全新的SM模块,CUDA翻倍

SM(Streaming Multi-processer,流式多处理器模块)模块一直是NVIDIA GPU的计算核心,在新核心的安培架构上,由于计算任务的变化,Ampere核心的SM模块也有了巨大的变化。

面向图形的安培架构的SM模块,可以看到其内部采用了FP32+INT32的设计。

图灵架构的SM模块。

NVIDIA Ampere架构核心的SM的计算单元内部,依旧配置了1个warp调度单元和1个派遣单元、16384×32bit寄存器和后端LD/ST、SFU单元,但是在计算的部分却包含了1组16个可自由执行FP32和INT32计算的双功能计算单元(ALU)——它们既可以完成FP32计算,又可以完成INT32计算,另外还包含了1组16个FP32计算单元和1个新的第三代张量核心。这样,同为4个SM计算单元组成的SM模块,GA10X安培架构拥有等效128个CUDA核心(极致情况下),相当于图灵核心的两倍。我们知道,图形和计算操作和算法、现代着色器工作负载通常混合使用FP32算术指令。FP32加速也有助于光线追踪降噪着色器。光线追踪渲染工作负载越大,相对于上一代产品的性能提升越大。

第二代RT Core光追核心

图灵架构为游戏引入实时光线追踪,轰动一时,为游戏带来了逼真的光照、图像质量、游戏玩法和沉浸感、阴影和特效,并带来超出想象的游戏画质表现。Ampere架构的第二代RT Core的性能提升一倍,带来2倍于Turing第一代RT Core的吞吐量,同时支持光线追踪和着色,使光线追踪性能达到全新高度。换而言之,光线追踪使用率越高,速度提升越大!同时第二代RT Core还引入了动态模糊等重要特性。

NVIDIA Ampere架构的RT Core将光线交汇处理速度提高一倍,同时支持光线追踪与着色。光线三角形吞吐量增加一倍,Ampere架构的RT Core可达39.7 RT TFLOPS,Turing架构为23.8 RT TFLOPS,提升巨大。

第三代Tensor Core张量核心

面向图形的安培架构也加入了第三代张量计算核心,专门为稀疏矩阵优化。RTX 3070 Ti所配置的Tensor Core可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。全新第三代Tensor Core加速AI功能,例如用于AI超分辨率的NVIDIA DLSS和用于AI增强的声画处理技术NVIDIA Broadcast应用。

在DLSS的支持下,不但游戏帧率有大幅度提升,在画面细节表现上也没有损耗,甚至画面清晰度更好。

从本质上讲,Tensor Core让DLSS能够加快游戏速度,同时带来高画质图像,甚至更细致的图像。借助第三代Tensor Cores的性能,NVIDIA Ampere架构GPU上的DLSS性能得到进一步增强。当前的NVIDIA DLSS已经进化到了2.1版本,支持最高9X的游戏帧速率加速,这对于防止在高分辨率下开启光追效果后的游戏帧率下跌有着非常重要的意义。

支持HDMI 2.1与AV1解码

支持HDMI 2.1将总带宽从18Gigabits/秒提高到48Gigabits/秒,并增加对高动态范围(HDR)的支持,支持更高对比度的明亮图像和更鲜艳的色彩,以及更好的阴影和高光。而AV1解码与现有的H.264、HEVC和VP9等编解码器相比,它能提供更好的压缩和质量,比H.264节省50~55%的容量;RTX IO,在DirectStorage加持下,下一代游戏将能够在降低CPU负载的同时,充分利用RTX IO硬件,缩短加载时间,打造更宽阔的开放世界。

支持NVIDIA Reflex低延迟电竞技术

上图所示测试数据来自NVIDIA官方资料,供参考。

游戏玩家通过鼠标按键触发的效果最终呈现在显示器画面上之前,按键触发的电信号需要先途径CPU进行逻辑运算,得到详实且准确的信息之后再提交给GPU进行渲染,并且将渲染后的数据最终以像素点填充的方式呈现到显示器上。在这个过程中,电信号从触发、传输再到显示的过程所产生的耗时便被称之为系统延迟。

而NVIDIA Reflex低延迟电竞技术便是在这个过程中起到至关重要的作用——它能够通过提升GPU的运行频率和动态的降低渲染队列,并由此降低CPU反压,使得系统能够在最后时刻采样外设的输入数据,从而最大化提高系统的响应速度,进一步提升玩家操作的准确度。通俗来讲,就是它能提高玩家从点击鼠标到显示器画面产生对应变化的速度,从而加快玩家的操作速度,带来更符合玩家水准且更为流畅的游戏体验。

另外,为了帮助玩家直观地查看系统延迟的具体情况,NVIDIA还将系统延迟根据鼠标输入信息到显示器过程拆分为鼠标输入延迟以及PC+显示器延迟两个部分。同时,玩家们可以通过最新版的GeForce Experience开启实验性功能,进而在性能覆盖显示的功能界面中获取游戏延迟和帧率等性能指标,查看当前PC的状态。它通过革命性的GeForce和G-SYNC新技术来优化和测量竞技游戏中的系统延迟,从而更快地获取目标,做出反应,并提高瞄准精度。

支持NVIDIA Broadcast

NIDIA Broadcast这项AI驱动的声画处理技术的基础是NVIDIA Encoder,支持高质量直播。用户可以通过RTX 30系显卡和Broadcast将自己的家改造成直播室,通过AI驱动的噪音消除、虚拟背景和自动取景等将直播和视频聊天提升到一个新水平。通过在GeForce RTX显卡上加速AI驱动的Tensor Core,AI网络能够保证高质量直播的实时运行。

散热结构变化,“加长版”RTX 3070

从外观设计上来看,GeForce RTX 3070 Ti的风格与RTX 3070几乎可以说是如出一辙,同样是冷酷与时尚并重的浓郁“全金属”风格,金属质感的香槟银配色外框搭配黑色硕大的散热片非常优雅,而S型的外框恰到好处地将散热结构切割成了两个部分。不过与RTX 3070采用正面同向双风扇的设计不同,RTX 3070 Ti似乎回归到了RTX 3080的那种正反双风扇前吹后吸的结构。左风扇将热空气从超大的通风口支架排出,独立的散热鳍片引导气流以达到更好的散热效果。外露的鳍片堆栈在视觉上和功能上提升以气流为中心的设计,与一体式框架一起,增强稳定性,在保证空气阻力最小的同时使鳍片堆栈体积最大。另一侧的风扇从显卡正面吸入冷空气,并将热空气从显卡背面吹出。这种下进上出的散热思路跟RTX 3080、RTX 3080 Ti一致,也符合当前绝大多数机箱的散热风道设计理念。

散热结构可以看作是RTX 3070的加长版,但风扇设计从正面同向双风扇改为了正反两侧的设计。

电源接口与RTX 3080一样,采用的是双PCIe 8Pin转专用12Pin的设计,而RTX 3070是单PCIe 8Pin转12pin。

视频输出接口为3DP 1.4a+1HDMI 2.1组合

RTX 3070 Ti FE在供电部分采用了12相结构设计,显存是来自美光的单颗1GB GDDR6X颗粒。可以看到RTX 3070 Ti仍然采用了异型PCB的设计,尾部被设计为了圆弧状缺口,看来是为背面的散热风扇腾出了未知。这种异型PCB设计虽然会导致PCB本身布局略显紧张,但也能为散热结构的设计提供更多冗余空间。

实测RTX 3070 Ti,1440p游戏毫无压力

NVIDIA GeForce RTX 3070 Ti Founders Edition产品资料

GPU架构:NVIDIA Ampere

核心代号:GA104-400-A1

制程工艺:SAMSUNG 8nm

SM模组数:48

CUDA Cores:6144

Tensor Cores:192 (第3代)

RT Cores:48 (第2代)

纹理单元:192

ROPs:96

GPU最高睿频:1770MHz

显存频率:9500 MHz(19Gbps)

显存容量:8GB GDDR6X

显存位宽:256-bit

显存带宽:608GB/s

TGP:290W

槽位:双槽卡设计

视频输出:DP1.4a×3,HDMI 2.1×1

参考价格:4499元(首发价格,仅供参考)

从规格上来看,RTX 3070 Ti相比RTX 3070来说有一定小幅度的加强。我们在之前测试RTX 3070时,3899元首发价格的RTX 3070被4599元的RX 6800在非光追游戏上压制得比较厉害,而偏偏NVIDIA在这个价位上的RTX 30系显卡是一片空缺。现在首发价格4499元的RTX 3070 Ti面世,不管是从价格定位还是性能跨度上来看,RTX 3070 Ti的“假想敌”都应该是Radeon RX 6800,因此RTX 3070 Ti与RX 6800之间的性能竞争,也是我们非常想要知道的。

此外,RTX 3070 Ti与RTX 3070以及RTX 3080之间到底存在多大的性能差距,这也是我们想要通过本次的实际评测解决的疑问。对现代应用来说,除了游戏之外,显卡的专业应用创作加速性能也同样被很多的消费者看重,RTX 3070 Ti在这一块市场上又有何表现呢?

于是,带着这些疑问,我们对RTX 3070 Ti进行了一番深度的测试。

测试平台

显卡:NVIDIA GeFroce RTX 3080

NVIDIA GeForce RTX 3070 Ti FE

NVIDIA GeForce RTX 3070 FE

NVIDIA GeForce RTX 2070 SUPER

AMD Radeon RX 6800

处理器:AMD锐龙9 5950X

内存:DDR4 3600 32GB双通道

主板:ROG CROSSHAIR Ⅷ DARK HERO

电源:ROG THOR 1200W

驱动:NVIDIA Game Ready Driver 466.61

AMD Radeon Software Adrenalin 21.5.2 Optional

系统:Windows 10 Professional 64bit(20H2)

在测试项目上,我们仍然是基于显卡评测的三部曲——3DMark测试理论性能,游戏测试游戏表现(分为光追游戏环境和非光追游戏环境两个部分),用专业应用软件或Benchmark来测试RTX 3070的创作加速性能。通过三个部分的综合表现,以此来综合判定RTX 3070 Ti的最终表现与市场期望。

3DMark理论性能测试

3DMark的理论性能测试结果基本在我们意料之中。相对于上一代的RTX 2070 SUPER,RTX 3070 Ti的平均理论性能领先程度超过了50%,远远地甩开了前者。相对于RTX 3080来说,RTX 3070 Ti的平均理论性能差距约为19%~20%,而相对于RTX 3070来说,RTX 3070 Ti的平均性能增幅在8%左右。

与潜在的对手Radeon RX 6800相比,GeForce RTX 3070 Ti在3DMark Firestrike三项测试中有不同程度的落后,大约在15%,这也是此前多次测试中发现的RDNA2架构的传统优势项目。而在3DMark Time Spy测试中,RTX 3070 Ti基本上与RX 6800握手言和,RTX 3070 Ti在TmeSpy Extreme 4K分辨率测试下小幅度领先RX 6800,而在TimeSpy 1440p分辨率测试下略略小负对手。不过在涉及光追性能的两项测试中,RTX 3070 Ti均表现出了明显的优势,分别在PortRoyal测试中领先RX 6800约14%,在DXR光追性能测试中领先幅度更是高达70%以上。

由于当前光追游戏可说已经是大势所趋,因此综合3DMark测试结果来看,RTX 3070 Ti的成绩可以说是与RX 6800互有胜负,用最简单粗暴的求平均值来看的话,RTX 3070 Ti在综合成绩表现上还略领先于RX 6800。

非光追游戏测试

在非光追游戏环境中,从测试结果来看,RTX 3070 Ti相对于RTX 3070的性能提升幅度比3DMark理论测试成绩要稍高一些,平均游戏性能领先在10%左右。不过相对于RTX 3080来说,RTX 3070 Ti在非光追游戏性能上仍有不小差距,平均性能落后25%左右。

在非光追环境下,RTX 3070 Ti的游戏表现相对于价格稍高的RX 6800确实略逊色一点点。在六个非光追游戏测试上,RX 6800在《杀手3》《极限竞速:地平线4》《刺客信条:英灵殿》以及《生化危机:村庄》4个游戏中领先于RTX 3070 Ti,但是在《尘埃5》《无主之地3》这两款游戏中,RTX 3070 Ti则反超了RX 6800,整体来看,RTX 3070 Ti与RX 6800的非光追环境平均游戏性能差距在5%左右,RX 6800略占优势。

光追环境游戏测试

在不开启DLSS的前提下,我们选择了五款同时支持NVIDIA和AMD GPU的光追游戏对RTX 3070 Ti进行了体验测试。从测试结果来看,开启光追效果之后,RTX 3070 Ti相对于RTX 3070性能领先约10%。但是相对于RTX 3080来说,RTX 3070 Ti在整体性能上落后高达30%左右。如果说在非光追环境下RX 6800相对于RTX 3070 Ti还略有一点点优势的话,那么在光追环境下,RX 6800则表现得非常乏力,整体性能在1440p分辨率下落后30%,在4K分辨率下落后程度更是高达40%(除开4K光追环境下“爆显存”导致的测试结果相差无几的情况),可以说已经与RX 6800拉开了几个档次以上的性能差距。

DLSS+光追,1440p全特效轻松搞定

可以看到,在开启DLSS之后,RTX 3070 Ti在光追环境下的游戏性能再次迎来了超级爆发。此前在1440p分辨率下无法达到流畅运行标准的几款游戏都达到了接近或超过60fps的绝对流畅标准线,比如《赛博朋克2077》《看门狗:军团》以及《地铁:离去 增强版》等。在开启DLSS之后,RTX 3070 Ti与RX 6800在光追环境下游戏性能差距被进一步放大,此时二者之间的性能差距已经达到了80%以上,个别游戏中甚至超过了100%。由此也可以看出DLSS对NVIDIA RTX GPU来说却是有着非同一般的意义。AMD此前也宣布6月份将会上线改善游戏运行分辨率的FSR技术,到时候它可能和DLSS又有一番争斗。

专业创作软件加速性能测试

接下来,我们也简单测试了一下RTX 3070 Ti在创作应用上的GPU加速表现。很明显,RTX Studio的生态覆盖已经非常成熟,当前绝大部分常用的应用软件都已经实现了RTX GPU的快车道加速。比如在Blender Cycles的静态CG渲染测试中,RTX 3070 Ti领先RTX 2070 SUPER超过了50%,相对于RTX 3070则有10%以上的性能提升,但是相对于RTX 3080来说,仍然有30%左右的性能差距。其他几款专业应用软件的测试结果也基本大同小异。而在与RX 6800的对比上,RTX 3070 Ti的优势更为明显,整体性能领先30%~100%,与前者拉开了非常大的差距。

温度与功耗

在最后进行的温度与功耗测试上,RTX 3070 Ti FE的实际测试功耗接近300W,多少有点“偏高”的味道,毕竟RTX 3070 FE才刚刚达到220W左右,这应该是GDDR6X带来的能耗提升。

而在满载核心温度的烤机测试上,RTX 3070 Ti FE的表现也不能称为优秀。满载烤机20分钟后,RTX 3070 Ti FE的核心温度达到了82℃左右,相比RTX 3070 FE提升了8℃左右。按理来说,RTX 3070 Ti相对于RTX 3070在CUDA核心上的提升只有256个,二者之间GPU核心温度控制应该不会这么大,而且RTX 3070 Ti在散热结构上还进行了强化,所以这难道是GDDR6X显存带来的额外提升?但不管如何,对比RTX 3080与RTX 3070的表现,我们还是认为RTX 3070 Ti在散热结构上还有提升的空间。

RTX 3070 Ti,1440p光追游戏稳妥

RTX 3070 Ti在我们看来是一款有些“特立独行”的产品。首先从硬件参数规格上,历代的“Ti”系列都是同一序列中的顶级产品,而且与上一序列的最低型号在性能上是比较接近的。比如RTX 3060 Ti的38组SM对比RTX 3060的28组以及RTX 3070的46组SM,RTX 3080 Ti的80组SM对RTX 3080的68组以及RTX 3090的82组SM。都能看到“Ti”系列的规格其实是更靠“上限”的。但是RTX 3070 Ti从硬件规格上却更靠“下限”——它只比RTX 3070多了2组SM模块但却比RTX 3080少了20组SM模块,这就导致了上下限之间的规格参数差距比较大,至少和我们最开始的预想有些不同,NVIDIA或许是有自己的产品规划考虑吧。

不过GDDR6X显存的加持还是为RTX 3070 Ti加分不少,这也使得RTX 3070 Ti在仅比RTX 3070多256个CUDA核心的情况下,依靠GDDR6X相对于GDDR6的性能提升,使得RTX 3070 Ti的整体性能提升幅度相对RTX 3070达到了10%左右。

从整体测试的情况来看,RTX 3070 Ti还是有比较优秀的表现,在性能上不但拉开了对RTX 3070的层次差距,而且相对于之前一直压制RTX 3070的Radeon RX 6800来说,在非光追环境下也拉近了与RX 6800的距离,使得RTX 3070 Ti与RX 6800在非光追环境下的性能差距缩小到5%左右,部分游戏中的表现甚至明显超越了RX 6800,比如《尘埃5》《无主之地3》等。而在开启光追效果后,RTX 3070 Ti更是将RX 6800甩在了身后很远的地方,整体30%以上的性能差距让RX 6800有些“鞭长莫及”,这也是硬件光追核心上的性能差距体现。对于各种光线追踪和光栅化的DirectX 和Vulkan游戏来说, RTX 3070 Ti在同价位产品中可以算是令人印象深刻的,它带来1.5倍于RTX 2070 SUPER的性能提升,如果同比2017年发布的GTX 1070 Ti,性能将高出2倍以上。

RTX 3070 Ti的首发价格为4499元人民币,相对于3899元首发价格的RTX 3070来说性能增幅与价格增幅的比例还是比较合理的。而相对于首发价格4599元的RX 6800来说,仅在非光追游戏性能上综合略有逊色,在光追游戏和专业应用创作性能加速上,RX 6800可以说是望尘莫及。综合性价比考虑的话,我们认为在4500元级价位的游戏显卡上,RTX 3070 Ti无疑是更值得考虑的主流显卡优选。而且从测试结果来看,在1440p光追环境及最高特效设置下,除个别游戏外,它也几乎能应付目前大部分主流光追游戏,性能表现还是非常不错的,结合4499元的价位,怎么买应该都不亏。

当然,我们做出的结论都是建立在有序的游戏显卡市场的前提下,而对目前仍处在扑朔迷离状态的游戏显卡市场来说,RTX 3070 Ti非公版产品首批上市的价格与数量仍旧是雾里看花,实在无法定论。还是那句熟悉的话,我们只想代表玩家真切地说一句,“不要空气卡,让我们都能买到吧!”

九尾妖狐阿狸配音 http://www.xinzhiliao.com/bj/meirong/29694.html
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
  • 标签:总裁 我们离婚吧
  • 编辑:黄金标
  • 相关文章
TAGS标签更多>>