今天IT之家为大家评测的,正是技嘉发布的“AI 卡”,GeForce RTX 4070 Ti SUPER AI TOP 16G 显卡。
这张显卡与技嘉游戏卡的设计风格完全不同,采用涡轮风扇散热,搭配磨砂金属框架。
技嘉 RTX 4070 Ti SUPER AI TOP 采用了全铜散热模组,外观整体风格更接近工作站显卡和专业卡。
显卡侧面除了有“GeForce RTX ”字样,还有“AI TOP”立体 LOGO。
配备了 3*DP 1.4a 和 1*HDMI 2.1a 接口。
16Pin 供电接口放置在了显卡角落,隐蔽且易于插拔走线。
显卡风扇处厚度 34.17mm,最厚处 40mm,仅有双槽厚度,在 4070Ti Super 的阵营中算是比较“苗条”的一张卡了。
显卡长、宽分别为 260mm*96.5mm。
显卡重约 1.2kg,从尺寸和重量也能看出用料还是很足的。
参数上,技嘉 RTX 4070 Ti SUPER AI TOP 与其它的 4070 Ti SUPER 差异不大,依旧采用 AD103 GPU,8448 个 CUDA 核心,核心频率最高 2610MHz,配备了 16GB 21Gpbs 256bit GDDR6X 显存。
接下来进入到理论测试环节,本次的测试平台如下表所示。
虽说这款 RTX 4070 Ti SUPER AI TOP 显卡定位不是游戏显卡,不过为了更直观的体现它的实力,IT之家还是先使用 3DMark 的测试项目来测试一下这款显卡的理论性能表现如何。
在 3DMark 测试中,IT之家测试了 Fire Strike Extreme、Fire Strike Ultra、Time Spy Extreme、Port Royal、Speed Way 以及 Steel Nomad 压力测试。在 Fire Strike Extreme 中,显卡得分 25910 分。
在 Fire Strike Ultra 中,显卡得分 13254 分。
在 Time Spy Extreme 中,显卡得分 10930 分。
在 Port Royal 中,得分 13146 分,显卡测试帧率 60.86FPS。
在 Speed Way 中,得分 5526 分,显卡测试帧率 55.26FPS。
在 20 轮循环 Steel Nomad 压力测试中,帧率稳定度 97.5%,最佳循环分数 5101 分。
整体来说,在 3DMark 的各项测试中,技嘉 RTX 4070 Ti SUPER AI TOP 表现还是不错的。
此外,IT之家也使用 PCMark10 对整机性能进行了测试,分数为 8935 分。
在跨平台的生产力测试 CrossMark 中,技嘉 RTX 4070 Ti SUPER AI TOP 总体得分 2529 分,在生产率、创造性、反应能力三个测试项目中都有不错的表现,尤其是创造性项目中,获得了 2749 的高分。可见其在创意工作场景中的强悍性能。
IT之家还进行了 Blender 和 V-Ray 渲染器的 Benchmark 测试。
在 V-Ray 的 RTX 渲染和 CUDA 渲染中,分别得分 5134 分和 2984 分。
除了理论性能外,IT之家还在 23℃的室温下对技嘉 RTX 4070 Ti SUPER AI TOP 进行了 10 分钟的烤机测试,测得平均功耗 289.4W,核心频率 2385MHz,GPU 温度 79.5℃,对于一款单涡轮风扇的显卡来说,表现相当不错。
首先是与这款显卡名字相符合的 AI 文生图测试,IT之家使用 Stable Diffusion 生成 1024*1024 分辨率的图片 5 批每批 8 张共 40 张,共耗时 2 分钟 59 秒,速度还是很快的。
在生产力方面,我们使用 UL Procyon 的视频编辑基准测试对技嘉 RTX 4070 Ti SUPER AI TOP 进行了测试,得到了 19588 分的成绩。
在实际的视频编辑工作中,得益于 RTX 40 系列搭载的 AV1 编码器,在预览、导出时的效率可以大幅提升,IT之家这里使用已经支持 AV1 编码的剪映专业版对一段 1min 的 4K 出镜视频进行导出,分别测试不同编码、以及是否开启硬件加速下的导出速度。
从实际测试结果来看,在技嘉 RTX 4070 Ti SUPER AI TOP 的双解码器加持之下,开启硬件加速后,导出时间大幅缩短,尤其是 H.265 编码和 AV1 编码下的导出速度,获得了成倍提升。
从上述测试可以看出,技嘉 RTX 4070 Ti SUPER AI TOP 确实对 AI 场景和生产力场景进行了针对性优化,在大显存、双解码器、Tensor RT 等硬件和功能的加持下,让生产力场景的体验更加优秀。
此外,技嘉还推出了 AI TOP Utility 应用程序,以适配越来越广泛的 AI 大模型训练需求,不过这款软件目前只支持 Linux 系统,因此IT之家没有进行体验,期待这样实用的软件可以进款登陆 Windows 平台。
如果你有 AI 方面的需求,或者生产力方面的需求,那么这款有着配套软件加持、AI 性能优化的技嘉 RTX 4070 Ti SUPER AI TOP 的确是个不错的选择,目前单卡到手价 7399 元。对于大模型训练需求的人群来说,这款显卡还支持多卡组合,对比专业显卡以及目前价格高昂的游戏显卡来说,多卡组合的方案反而颇具性价比。
技嘉RTX 5080超级雕评测 DLSS 4让帧数突破显示极限!
RTX 50系的游戏旗舰RTX 5080显卡已经于1月29日解禁,也就是大年初一。不过相信彼时大家正沉浸在新春佳节的氛围中,鲜有人关注显卡评测。今天继续为大家带来AORUS Geforce RTX 5080 MASTER 16G的显卡评测,此前没有关注RTX 5080首测的朋友,可以再详细的了解一下。
本代RTX 5080显卡依然定位4K高分辨率下的高帧光追游戏,并且在Blackwell架构中新引入了DLSS 4,不仅可以做到电竞级帧率,甚至部分游戏中,能够超越300帧,甚至400帧!
另外作为每一代的准旗舰级产品,不仅游戏方面实力强大,同时凭借大显存,亦可担当生产力工具,是万元以下最具实力的多面手。
在整个RTX 50系显卡中,AI的比重都有着明显提升,不管在架构层面、游戏领域,还是内容创作,AI已经做到各个应用领域的底层覆盖,包括任何级别显卡都可使用的DLSS 4 AI多帧生成、针对内容创作的神经网络渲染,以及直播会议应用NVIDIA Broadcast。AI不再局限于文生图和语言问答那么显而易见,而是融入到了我们的日常生活中。
本次我们评测的显卡为AORUS MASTER超级雕,是技嘉的高端旗舰系列,不管是用料规格还是实际的性能都无愧于超级雕的名号,下面我们先来看看AORUS Geforce RTX 5080 MASTER 16G这张显卡的外观。
1 AORUS Geforce RTX 5080 MASTER 16G概览
AORUS Geforce RTX 5080 MASTER 16G的包装依然沿袭了家族风格设计,正面除了高端AORUS系列的logo标志外,还有象征着旗舰地位的MASTER超级雕图腾,主视觉下方则是NVIDIA的规范色调和型号标志。
配件方面AORUS Geforce RTX 5080 MASTER 16G除了拥有标准的显卡支架、和8pin*3转16pin(12+4)转接线。不过最醒目的要数这个散热风扇,下面我们也会详细说明它的用法。
AORUS Geforce RTX 5080 MASTER 16G的整体外观设计与RTX 40系的风格相仿,不过在细节上仍有较大的变化。整体尺寸为360×150×75mm,采用3.5槽设计。
AORUS Geforce RTX 5080 MASTER 16G整体采用纯黑色设计,不过相比前代更具有立体感。饰边的彩虹色流畅线条营造出广阔的空间感,同时也为纯黑色的导流罩增添了一丝活力。
风扇周围的图案和漩涡灵感设计突出了动态 三环灯效,营造出迷人的光线和运动相互作用。正面采用分层纹理,具有不同的饰面,将力量与优雅完美融合。
AORUS Geforce RTX 5080 MASTER 16G的主动散热部分,采用仿生风扇设计。叶片设计灵感来源于鹰的翅膀空气动力学,有效降低了风阻和噪音,在低噪音表现的同时,可将风压提升高达53.6%,风量提升12.5%。同时正逆转的运行方式,可减少相邻风扇之间的扰流并提高气流压力。
内部采用双滚珠轴承结构,比传统结构具有更好的耐热性和效率,使用寿命更长。并且当GPU温度较低或处于较低负载时,风扇将会自动停止运转,提供零噪音的舒适体验。
AORUS Geforce RTX 5080 MASTER 16G依然采用了上一代的RGB炫彩光轮设计,可通过GCC软件选择灯光效果或与GCC中的其他设备同步。不过这种光轮设计,必须要在显卡有一定负载的情况下才能看到。
在显卡侧面,LCD显示屏不仅显示显卡信息,还可自定义文本、图片和 GIF。还可以通过 GCC(技嘉智能管家) 调整灯光效果。
在视频输出接口上,AORUS Geforce RTX 5080 MASTER16G采用了HDMI 2.1b*1 + DP2.1b*3的四接口设计。
其中DP 2.1b接口为UHBR20规格,可达 80Gbps 带宽,最高支持8K (7680×4320)@165Hz(DSC);4K (3840×2160)@480Hz(DSC)。另外需要注意的是,要达到 80Gbps 带宽需要DP80LL认证的线材。
本次AORUS Geforce RTX 5080 MASTER 16G的TDP官方给出的为360W,搭载单16pin(12+4)辅助供电,建议电源850W。
AORUS Geforce RTX 5080 MASTER 16G的电源接口设计具备指示灯提示功能,用于提高使用安全性并避免因连接问题导致的隐患:熄灭表示电源连接正常;亮起表示电源线未连接;闪烁则表示电源异常。
另外这张显卡的电源接口同样有着人性化设计,它的连接位置下凹,远离显卡边缘,这样在装入机箱中,可增加线材与机箱挡板的空间,减少电源线弯折的风险,提升16pin电源接口的兼容性和安全性。
AORUS Geforce RTX 5080 MASTER 16G采用了一体化金属背板,放射性的线条由AORUS的图腾延伸至I/O区边缘,而右侧为大面积裸露的散热鳍片。
同时在内部散热系统上,采用了大型均热板直接与 GPU 接触,再加上复合式热管,可快速将 GPU 和 VRAM 的热量传递到散热器。
AORUS Geforce RTX 5080 MASTER 16G采用了弯角鳍片设计,棱角分明且不等的鳍片高度设计有效地引导鳍片之间的气流,从而增加与空气的接触表面积并提高散热效率。
包装内附赠的散热风扇可置于背板尾部,裸露的散热鳍片上方,增加主动散热效果,有助于将鳍片热量快速带走。在风扇底部有橡胶垫,可沿背板的轮廓扣入,竖装显卡也无需担心掉落。不过风扇的连接线均需要装在主板上,对于主板针脚接口紧张的用户不太友好。
2 GCC(技嘉智能管家)
GCC(技嘉智能管家)是适用于GIGABYTE产品的统一软件。它提供更加直观的界面,允许用户实时调整核心频率、电压、风扇模式和功耗。
在GCC灯效界面,如果使用配套的技嘉主板,默认则会开启灯光同步,此时无法单独调节显卡风扇灯效,需断开同步。
单独调节显卡灯效后可分别调节风扇、背板以及侧面的灯光效果,默认情况三处灯光会同时改变,灯效共有多达12种。如果想实时预览的话,可以打开烤机软件让显卡负载,否则风扇不转的情况下灯光是不亮的。
在性能界面,可分别监控和调节板卡的参数,不过这更多的是为进阶玩家准备的。普通用户看看就好,也尽量不要调节。
最后在LCD Panel界面,可调节显卡侧面屏幕的显示效果,除了预设的几种效果,也可自定义GIF或图片进行上传。
3 NVIDIA RTX Blackwell架构
GeForce RTX 50系显卡由全新的NVIDIA BlackWell架构打造,本次评测的RTX 5080则采用GB203核心,配备10752个CUDA,84个RT Cores;336个Tensor Cores和336个纹理单元。
完整的GB202核心包括12个图形处理集群(GPCs);96个纹理处理集群(TPCs);192个流式多处理器(SMs),和一个512bit总位宽,包含16个32bit内存控制器的内存接口。
对应到我们熟悉的数字,则是24576个CUDA,192个RT Cores;768个Tensor Cores以及768个纹理单元。由于第5代Tensor Cores采用了更高速的FP4运算,完整的GB202可达到恐怖的4000 AI TOPS;而第4代RT Cores采用的新的几何运算模型,也让它可以达到360 RT TFLOPS。
RTX 5090 PCB
另外,每个SM单元中还包含两个FP64内核,总共384个。FP64内核主要目的是确保带有FP64代码的程序可正常运行,并确保准其确性。这对于某些专业领域来说至关重要,比如医学或专业计算领域。
GPC是GPU中占据主导地位的高级模块,所有关键的图形处理单元都位于GPC中。在RTX 50系中,GPC整体的布局变化不大。
每个GPC包含一个专用的光栅引擎,两个ROP分区。每个分区包含8个单独的ROP单元和8个TPC,每个TPC包含1个变形引擎和两个SM单元。
完整的GB202核心还包含128MB的L2缓存。大缓存的变更自RTX 40系显卡便已开始,所有程序都可以受益于这个高速大容量的缓存池,而光线跟踪(特别是路径跟踪)等复杂操作将产生巨大的好处。
SM单元是GPU架构中的核心组件,在GPU并行处理中发挥着关键作用,它通过其各种核心(CUDA,Tensor,RT),高效的warp调度,内存管理以及对AI等现代工作负载的支持实现大规模并行。本代RTX 50系显卡中SM单元的变化非常大,下面我们详细来了解一下。
完整的GB202核心包含192个SM单元,每个SM包含128个CUDA核心;1个第4代RT Core;4个第5代Tensor Core;4个纹理单元。1个256KB的寄存器文件和128KB的L1共享缓存,它可以根据图形和计算工作负载的需要配置不同的大小。
在Blackwell架构的SM单元中,INT32整数运算的数量增加了一倍。与Ada架构的SM单元相比,实现了INT32与FP32内核的完全统一。不过在时钟周期内,统一内核只能作为FP32或INT32内核运行。
与Blackwell架构一同推出的还有GDDR7显存,采用pam3信号技术,它有着更高频率与更低电压的特点。
本代RTX 5090配备28 Gbps GDDR7显存,峰值显存带宽可达1792GB/s/秒,而RTX 5080配备更高的30 Gbps时钟频率的GDDR7显存,峰值内存带宽可达960 GB/秒。结合新的引脚编码方案,GDDR7实现了显著增强的信噪比(SNR)。
通过增加信道密度、改进的pam3信噪比、先进的均衡方案、重新设计的时钟架构和增强的I/O训练,GDDR7提供了更高的带宽。这些进步还显著提高了能源效率,提供了更好的性能和延长电池寿命,特别是在移动端,或功率受限的系统中。
Blackwell 第4代RT Core
在第4代RT Core中,简单来说它相比Ada架构,在渲染光线追踪场景时,提供了两倍光线三角形相交测试吞吐量,并引入了Mega Geometry的结构算法。
Opacity Micromap Engine
不透明微引擎在Ada架构中已经引入,这里不再过多讲述,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。
比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的。
不过Opacity Micromap Engine可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担。
RTX Mega Geometry
除了上面提到的Opacity Micromap Engine,在BlackWell架构中,还引入了Mega Geometry(大型几何)的运算概念。其中包含了Triangle ClusterIntersection Engine、Linear Swept Spheres等新硬件。
新的Blackwell RT核心包含一个Triangle ClusterIntersection Engine三角形群集交集引擎,它能够进一步加速大型几何的光线追踪,同时它的工作还包含标准的光线三角形交集测试。Linear Swept Spheres则主要用于光线追踪中精细的几何形状,比如发丝。
RTX Mega Geometry的理念与虚幻5引擎的Nanite虚拟微多边形几何体系统相同,在现代游戏中,模型更加细致,需要渲染的工作量大幅增加,如果全部按照最精细的级别处理,将会耗费极大的计算资源,所以将LOD分级便应运而生。
简单来说,就是根据一个物体距离摄像机的远近,来调节物体的细节水平。此前《黑神话:悟空》便应用了这样的技术,它消除了LOD的繁琐任务,可以扫描并导入极高精细程度的模型。并且,这不会影响性能。仍然可以获得实时帧速率。
在RTX Mega Geometry中提供了新的BVH构建功能,它采用三角形集群作为一级基元。新的集群加速结构Cluster-level Acceleration Structures(CLAS)可以从256个三角形空间紧凑批次中生成,然后使用CLAS集合作为输入来构建最终的BVH。
不过虚幻5引擎并非专为Blackwell而设计,RTX Mega Geometry的工作只是更高效的让游戏引擎调用API。由于其输入参数完全由GPU内存驱动,游戏引擎可以在GPU上更高效的运行LOD选择、动画、剔除等逻辑。同时最大限度减少对CPU的往返,进而减少与BVH管理相关的CPU开销。
然而在更加精细化的游戏引擎中,按照传统的流程,应用程序必须从场景中的每一帧的所有对象中构建一个顶层加速结构。而随着更大的世界规模以及繁杂的场景物体,仅靠LOD分级仍然难以实现质的变化。
为了解决这个问题,RTX Mega Geometry引入了一种新型的顶层加速结构(TLAS),称为分区顶层加速结构(PTLAS)。
它无需在每一帧都从头开始构建一个新的TLAS,PTLAS能够辨别从一帧到另一帧,哪些对象是静态的。
应用程序通过将对象聚合到分区中,并仅更新那些已更改的对象来节省开销。
例如,游戏可以将静态游戏世界的各个部分放入所属的分区中,同时将动态对象分离到每帧重建的“全局分区”中。与传统的TLAS相比,请求的分区更新越少,节省的运行时开销就越大。
另外好消息是,RTX Mega Geometry可通过底层API进行扩展支持,适用于所有支持光线追踪的NVIDIA GPU,也就是从图灵架构(Turing)开始。
不过Blackwell的第4代RT Core是专门为RTXMega Geometry而设计的,硬件中的特殊集群引擎实现了几何和BVH数据的新压缩方案,同时是第3代RT Core光线三角形相交率的2倍。因此,Blackwell架构可以实现用更小的显存,更高效的处理这些内容。
Linear Swept Spheres (LSS)
LSS(线性扫描球体)是Blackwell架构中新增的图形语言,它极大地简化了复杂头发和毛发的渲染开销,并能提升质量。
此前渲染头发仍然需要最基础的三角形来表达物体,如图所示,发丝中的一个线段需要6个三角形,而一根头发便需要无数个三角形来确保其精度。比如我们的头发则需要600万个三角形来表达。
Blackwell架构的RT Core引入了LSS新语言的支持,它类似于镶嵌曲线,允许灵活地近似各种链型。并且球体也更适合发行构建。
LSS的引入可以让发型构建,减少3倍的数据量,速度大约快了2倍,并可以使用更少的显存,获得更高的帧数。
Blackwell 第5代Tensor Core
本代架构除了RT Core进行了改进升级,专门负责AI及高性能计算的Tensor Core也迎来了重大升级。
与NVIDIA Ada Tensor Cores一样,Blackwell架构的Tensor Cores支持FP16、BF16、TF32、INT8、INT4和Hopper的FP8 Transformer Engine。
Blackwell还增加了对FP4和FP6 Tensor Core操作的新支持,以及新的第二代FP8 Transformer Engine。
FP4精度支持
FP4提供了一种较低的量化方法,类似于文件压缩,可以减小模型大小,提升生成速度。与FP16精度(大多数型号发布的默认方法)相比,FP4只需要不到一半的显存。FP4使用NVIDIA TensorRT提供的量化方法,几乎没有质量损失。
例如,目前最强的AI绘画模型FLUX.dev ,在FP16上需要超过23GB的显存,而这意味着它只能由每一代的期间产品RTX 4090,RTX 5090和专业GPU来支持。
而对于FP4,FLUX.dev测试对显存的需求将少于10GB,让更多80级和70级的显卡均能在本地运行。
在性能和效果对比上,使用带有FP16的RTX 4090,FLUX.dev模型可以通过30个步骤在15秒内生成图像。使用带有FP4的RTX 5090,只需5秒多一点就可以生成图像。
DLSS 4
DLSS 4是本代RTX 50系显卡带来的重大更新,对于玩家来说它也是最能实际感受到的。最新版本DLSS 4带来了新的多帧生成(MFG),具有更快的性能和更低的显存使用等特性。包含超分辨率(SR),光线重建(RR)和深度学习抗锯齿(DLAA)模型,可进一步增强图像质量和稳定性。
这些新技术由RTX 50系GPU和第5代Tensor Cores支持,并由云端的NVIDIA Al超级计算机提供支持。不过对于手持RTX 40系或更早期显卡的玩家还无缘体会。DLSS 4新增的多帧生成,目前仅支持RTX 50系显卡。
Multi Frame Generation(多帧生成)
DLSS多帧生成能够通过每个传统渲染帧,生成多达三帧的额外帧来提高FPS。新的帧生成AI模型相比之前的帧生成方法快40%,使用的显存减少30%,并且每个渲染帧只需要运行一次就可以生成多个帧。高效的AI模型代替了上一代的硬件光流模型,从而加快了光流场的生成速度,并显著降低了生成额外帧的计算成本。
从生成帧的层面来说,上一代DLSS 3帧生成基于CPU的帧节奏,而这种方式可能会让生成的帧与额外的帧混合在一起,导致每帧之间的帧节奏不太一致,影响平滑性。
为了解决生成多帧的复杂性,Blackwell架构将帧节奏逻辑转移到显示引擎,使GPU能够更精确地管理显示时序,从而避免与额外帧混合的情况,进而提升帧生成的准确性及稳定性。
而第5代Tensor Cores拥有更高的计算能力,这使得它们能够更快地执行计算光流和生成多帧的一系列AI模型。并更好地调度DLSS AI处理、图形渲染和帧速度算法。
Transformer模型
此前DLSS所用的模型为Convolutional Neural Network,即我们熟悉的卷积神经网络(CNN),CNN的工作原理是将像素局部聚集在一起,并以树的形式从低到高地进行分析数据。这种结构的计算效率很高,这也是为什么它被称为卷积神经网络。
而DLSS 4引入了基于Transformer的AI模型,用于DLSS超分辨率、DLSS光线重建和深度学习抗锯齿(DLAA),从而提高图像质量和渲染平滑度。基于Transformer模型体系结构的神经网络,擅长处理涉及顺序和结构化数据的任务。简单来说,就是Transformer能够抓住“重点”,可以更好地理解和渲染复杂场景。
与CNN模型相比,Transformer更容易在更大的像素窗口中识别更远距离的模式,具有一定的学习能力和“前瞻性”。
本代DLSS 4将基于CNN的神经网络结构,转变为基于Transformer的神经网络结构,在许多场景下图像质量都有着显著提升。
Shader Execution Reordering (SER) 2.0
Shader Execution Reordering(着色器重排序)是在RTX 40系架构中引入的一项技术,它可以使带有光追的程序有效地重组GPU上的大量并行线程,以最大限度地利用硬件。
因为连贯执行神经工作负载的线程可以直接发送到Tensor Core,所以SER也显著加速了神经着色。在Blackwell架构中,SER的核心重排序逻辑效率是原来的两倍,减少了重排序开销并提高了精度。从而进一步提高了该功能的有效性。这项功能更多地是为应用程序开发者而设计,它仅需一个小的API改动,即可执行重排序操作,进而提升总体项目的负载性能。
4 测试平台简介
首先介绍一下测试平台,为了保障AORUS Geforce RTX 5080 MASTER 16G的性能发挥,我们的平台也再次进行了全面更新。
除了AORUS Geforce RTX 5080 MASTER 16G这张显卡,处理器选择了AMD R7 9800X3D游戏神U。
为了方便观察DLSS 4在画质上的提升和4K高帧率带来的游戏变化。我们选择了技嘉FO32U2P OLED显示器,这款显示器采用了4K@240Hz的高分高刷规格,可完美适配DLSS 4的多帧生成。而99%的DCI-P3色域覆盖,更可细致入微地观察Transformer模型带来的细节提升。
本次RTX 50系显卡采用了带宽速率更高的PCIe5.0x16,应用于显卡的PCIe5.0x16带宽速度高达128GB/s,用于固态硬盘的PCIe5.0x4也高达32GB/s,致态TiPro9000,实测顺序读写速度高达14526.95MB/s和13869.24MB/s,达到“满血”级别,可大幅提升操作系统/大型游戏/创作软件的响应和加载速度。
首先看一下GPU-Z的参数,最新的2.62版本已经能够识别GPU信息。AORUSGeforce RTX 5080 MASTER 16G采用GB203核心,采用与上一代相同的TSMC 4nm定制工艺(TSMC 4nm 4N NVIDIACustomProcess),芯片面积378mm相比于RTX 5090的750mm小了一半。值得注意的是,在RTX 50系显卡中,使用了PCIE×165.0带宽。
显卡拥有10752个CUDA,Boost频率达到了2805MHz,相比公版的2617MHz,提升非常大。采用16GB GDDR7显存,位宽为256bit,实际的显存带宽达到了960 GB/s,光栅单元和纹理单元为112/336。
5 理论性能测试
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在针对显卡DX11性能的3DMARK FS套装测试中,AORUS Geforce RTX 5080 MASTER 16G的提升对比RTX 4080 SUPER,在三档分辨率中的提升分别为,15%/24%/26%,综合提升约为22%。
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,AORUS Geforce RTX 5080 MASTER 16G相较RTX 4080 SUPER的提升分别为:TS提升18%;TSE提升18%,综合提升约为18%。
PortRoyal是3DMARK中专门针对光追性能的测试项,AORUS Geforce RTX 5080 MASTER 16G相较RTX 4080 SUPER的提升约为26%。
综合来看,AORUS Geforce RTX 5080 MASTER 16G的理论性能相较RTX 4080 SUPER的提升约为22%。
下面我们再来看看3DMARK中新增的一些具体应用场景的测试。
Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。
AORUS Geforce RTX 5080 MASTER 16G对比RTX 4080 SUPER,提升为25%。
在DLSS的理论测试中,有着较大变化,共分为两种模型。DLSS 2及DLSS 3采用上一代的CNN模型,而最新的多帧生成,则采用了Transformer模型,并且多帧生成可调节生成帧的数量。
从测试结果来看,DLSS 4 2X基本可以看作是DLSS 3的帧生成,而相比上一代DLSS 3,DLSS 4 4X模式下,帧数综合提升在75%左右,其中在4K和8K提升非常大,在79%左右。而8K分辨率,80及显卡也是史无前例的达到163帧的成绩。
通过DLSS的理论测试,不难发现8K高刷对于RTX 50系显卡来说早已不是触不可及的目标,而在4K分辨率下,更是突破目前旗舰显示器的上限,达到306帧。
下面我们先实际测试DLSS 4在游戏中的表现如何,能否达到理论测试的提升效果。
6 DLSS 4性能测试
本次DLSS 4在解禁首日,便可支持75款游戏或应用。除了游戏中首发支持外,对于尚未集成的游戏,可在NVIDIA app中进行直接调节非常方便。
在DLSS 4的测试中,首先来看《赛博朋克2077》,目前该游戏随着RTX 50系显卡的性能解禁,也已经更新了DLSS 4,如果首发买了显卡,也可自行测试一番。
《赛博朋克2077》
下面的测试中我们会进行多角度对比,来看看不同DLSS的设置下,三档画质的帧数表现。
在所有测试中,为保证缩放比例固定,我们均选择在DLSS 质量模式下进行。
传统DLSS 2的测试中,使用CNN模型DLSS,可以看到即便是AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下,光追超级画质也仅有69帧,而在光追超速模式下为43帧,无法做到流畅运行。
DLSS 3的测试依然为CNN模型,增加帧生成。可以看到DLSS 3已经可以大幅提升帧数,相较DLSS 2,在4K超级画质/光追超级/光追加速 的提升分别为63%/62%/70%,综合提升65%。
在DLSS 4的测试中,模型更改为Transformer,开启多帧生成,首先测试3X下的表现。
AORUS Geforce RTX 5080 MASTER 16G在4K超级画质/光追超级/光追加速中,相较DLSS 3帧生成的提升分别为27%/37%/42%,将帧率再次拉至新高度,即便在光追超级画质下,也能达到153帧的电竞级帧率。
另外注意,在1080p分辨率的超级画质中,已经达到了惊人的477帧!虽然仅仅是超级画质,但这依然是标准的3A游戏《赛博朋克2077》。
DLSS 4最后的测试为Transformer模型4X帧生成模式,在4K超级画质/光追超级/光追加速中,相较DLSS 4的3X帧生成的提升分别为26%/26%/29%,即便在光追加速画质中,此时光追加速画质也已经来到了127帧。
除了帧数上的提升,DLSS 4对于画质表现如何,下面我们来看看实机截图对比。
可以看到在采用Transformer模型的DLSS 4中,物体表面的纹理细节更清晰。即便是没有模型面覆盖的锈迹,DLSS 4依然能精准还原。
同理,墙上的裂纹在DLSS 4中有更明显的痕迹。并且整体画面相较于DLSS 3,更通透明亮。大家也可下载4K图片自行比对。
《漫威争锋》
《漫威争锋》是近期大火的FPS+MOBA类网游,最初被看作《守望先锋》的替代品,但实际游玩效果,无论画面还是玩法,都更胜一筹。
截至目前,Steam已经有超过18万评价,整体为特别好评。而且《漫威争锋》是免费网游,大家下载尝鲜DLSS 4。
对于一款竞技网游来说,高帧率比画面更重要,使用AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下,DLSS 2质量模式已经能够达到114帧的高帧率。
在4K分辨率下的DLSS 3帧生成模式中,相比DLSS 2在质量模式中提升了31%,达到149帧的电竞级帧率。
而在DLSS 4 4X多帧生成中,4K分辨率相比DLSS 3质量模式再提升89%,达到281帧。至于大部分超高刷的1080p FPS电竞显示器,544帧也已经完全能够顶格跑满了。
在画面对比中,DLSS 4 4X的四档画质也很难看出区别,角色的头发、衣服,远处的建筑涂绘,基本都和原生画质分毫不差。
《霍格沃兹之遗》
《霍格沃兹之遗》同样新增了对DLSS 4的支持,测试分为超高画质,与打开光追后的超高画质两种参数。
在无光追的情况下,AORUS Geforce RTX 5080 MASTER 16G运行这款游戏毫无压力,即便均为DLSS质量模式下,4K DLSS 4 4X模式也有347帧。
打开光追后,这款游戏对于配置要求激增,不过可以看到在1080p分辨率下与2K分辨率帧数基本相同,应该是低分辨率下优化尚存在问题。
打开光追后,虽然对于配置要求激增,但同样画面表现有着明显区别,其中最明显的则是水体,能够明显看出随着深度不同,水体颜色的变化。
另外光线重建则能够修复一些画面的细节表现,比如图中圈出的部位,开启光线重建后,建筑的光影层次更分明。
《Alan Wake 2》
在《Alan Wake 2(心灵杀手2)》的测试中,我们选择默认高画质,不过可以注意到并非所有选项都开至最高,如体积光和体积聚光灯质量。
《Alan Wake 2(心灵杀手2)》是被誉为次世代最强画面的游戏,对于配置需求极高,但同时画面表现堪称完美。AORUS Geforce RTX 5080 MASTER 16G在不开启光追的情况下,4K分辨率DLSS 4 4X 质量模式下,可达250帧左右。
而在开启光追极致画面后,即便有着DLSS 4多帧生成的加持,AORUS Geforce RTX 5080 MASTER 16G也只有114帧左右。
《Alan Wake 2》整体画面较为昏暗,但光影氛围刻画非常到位。在开启光追后,阴影的表现更清晰,更符合真实的物理表现,同时水体与《霍格沃兹之遗》相同,均能够表现出水潭的深浅,相比原生画质,游戏的代入感更强。
7 常规游戏性能测试
除了支持DLSS 4的游戏,我们同样测试了一些主流的3A大作和支持DLSS 3的游戏,为更多玩家提供参考方向。
《黑神话:悟空》是一款妇孺皆知的国产虚幻5巨制,自带DLSS 3帧生成。我们的两项测试也全部开启帧生成,均为影视级画质。实测AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下最高已经达到了133帧。
在《黑神话:悟空》中,开启全景光追后,部分帧数反而更高,这一问题至少目前在benchmark中并未修复。
从AORUS Geforce RTX 5080 MASTER 16G这张卡的实测结果来看,4K分辨率下开关光追在超级性能模式中帧数差别不大,而从我们此前的测试来看,使用虚幻5引擎的《黑神话:悟空》不同DLSS档位下的画质几乎没有差距。
如果扔想获得比较高的画质,可以选择性能模式游玩,对于很多风景党来说,可既享受高帧率的同时,又不损失画质。
《燕云十六声》是网易开发的一款国产武侠大作,在DLSS 2的测试中,2K与4K的成绩几乎完全相同。这绝对是目前游戏优化尚不完善,至少在低分辨率下AORUS Geforce RTX 5080 MASTER 16G的表现应该更好。
而在DLSS 3的测试中,仍然出现了DLSS 2中的问题。不过在4K分辨率下AORUS Geforce RTX 5080 MASTER 16G大部分DLSS成绩均在200帧左右徘徊,超级性能更是达到了231帧。
近来同样大火的《三角洲行动》测试中,DLSS 2的优化同样有些问题。不过AORUS Geforce RTX 5080 MASTER 16G在4K分辨率DLSS质量模式下,达到172帧的电竞级帧率,性能模式更是达到206帧。
加入帧生成的测试后,低分辨率下的帧数表现恢复了正常。并且AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下的成绩,均在200帧以上。不管是大战场还是战役,都无足为惧。
《地平线5》也是显卡测试的常驻游戏,其凭借出色的优化,在原生效果下即可跑出优秀的成绩。AORUS Geforce RTX 5080 MASTER 16G在DLSS 3 4K分辨率下再创新高,达到194帧的成绩。
在《刺客信条:幻景》中,我们关闭游戏的自适应帧率,分别测试DLSS不同挡位与原生画质下的差异。
AORUS Geforce RTX 5080 MASTER 16G在4K分辨率原生画质下即可达到百帧的成绩,而在DLSS超级性能挡位中,达到185帧。
在《无主之地3》中,AORUS Geforce RTX 5080 MASTER 16G相比RTX 4080 SUPER的提升分别为:1080p提升5%;2K提升11%;4K提升19%,综合提升12%。在纯光栅化游戏帧数对比中,《无主之地3》比较能概括RTX 5080与RTX 4080 SUPER的光栅化性能的综合差距。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,虽然游戏较老,但对于性能要求却非常高,本次测试条件为“RTX最高/DLSS质量”。
性能方面,AORUS Geforce RTX 5080 MASTER 16G相比RTX 4080 SUPER的提升分别为:1080p提升14%;2K提升18%;4K提升21%,综合提升18%。
8 专业软件测试
本代RTX 5080拥有16GB的显存,而且新架构对于内容创作软件同样有优化,下面我们分别测试了不同类别的专业软件,来看看实际效果。
V-Ray6
V-Ray6对于GPU的测试分为RTX与CUDA,这里主要看RTX成绩,其中RTX测试相比RTX 4080 SUPER(7047)首测时提升35%左右。
UL Procyon
本次测试UL提供了FLUX.1 Dev绘画模型的FP4测试,该模型在FP16上运行需要超过23GB的显存,而这意味着它只能由每一代的期间产品RTX 4090,RTX 5090和专业GPU来支持。但FP4只需要不到一半的显存。而且FP4使用NVIDIA TensorRT提供的量化方法,几乎没有质量损失。更小的显存消耗让更多80级和70级的显卡均能在本地运行。
Blackwell架构新的Tensor Core特性不仅让生成所需的显存显著减少,在生成时间也有大幅降低,平均4张图片即可节省20秒时间。
FP4渲染生成图片
FP8渲染生成图片
在结果对比中,FP8和FP4所生成的图片效果是相同的,在细节和图片精度上均有着良好表现。
Keyshot 2024
Keyshot是一款专注于模拟光线追踪的渲染软件,并可分别调用CPU或GPU进行渲染,下面我们看下最终的渲染时间和结果。
使用AORUS Geforce RTX 5080 MASTER 16G渲染一张4K分辨率,采样率为1000的图片,最终用时99秒左右。
而使用CPU渲染(AMD R7 9800X3D),则需要1小时35分钟左右。并且从图片细节来看,两种渲染方式几乎没有不同。所以GPU对于内容创作者来说,效率的提升是不言而喻的。
9 NVIDIA Broadcast
NVIDIA Broadcast是一款用于直播或会议的AI软件,目前随着RTX 50系的发布,也进行了版本更新。
新版NVIDIA Broadcast界面更小巧,纵向布局也更方便视频直播中调节选项。
NVIDIA Broadcast一些经典效果更方便开启,其中目光接触功能非常适合远程会议,即便眼睛盯着屏幕,也能让参与人员时刻注意到你的眼睛,并且还有一定“大眼”效果。
虚拟补光仍是测试版功能,它可以在光线较暗的情况下进行面部的AI补光,看你看起来仍然处于光线较好的环境中。
在新的NVIDIA Broadcast中,还增加了GPU利用率的显示,当软件中功能全部打开时,对于GPU的占用率还是非常高的,比较适合会议等不需要过多GPU参与的场景。而如果是游戏直播,则可适当关闭AI效果,以降低GPU利用率。
不过目前新版NVIDIA Broadcast仍处于测试阶段,实际效果与GPU开销应以正式版为准。
10 NVIDIA App
新版的NVIDIA app代替了原来的GFE软件,并且功能更强大,使用起来也更方便。最主要的是,它不用登陆了,即下即用。
在NVIDIA app首页除了显示最新的驱动信息,还新增了NVIDIA周边软件的下载,比如AI绘画Canvas;图像视频对比工具ICAT;性能测试工具FrameView等等,不用再去NVIDIA官网寻找。
从APP中强制开启DLSS 4的功能上面已有介绍,不过目前并不是所有游戏和软件均支持此功能。
系统界面中则更多的是调试类功能,如显示器、视频、超频等。
其中性能界面提供了较为详细的监控和超频选项,需要注意的是新手如果想尝试超频,尽量不要改变电压,这个选项轻则掉驱动,重则烧毁显卡。
另外玩家可放心大胆地使用NVIDIA app中的性能自动调优功能,经过NVIDIA反复验证过的参数都是在安全范围内,并且出现问题的话,这张卡仍然具备保修资格。
NVIDIA信息浮窗是游戏中很好的辅助工具,要开启此功能,需要在APP主界面的设置一栏中,开启按钮,之后按【ALT+Z】即可呼出边栏。
按【ALT+R】可呼出统计数据的浮窗,功能设置和自由度的调节也非常丰富,最主要的是相当简便。
11 功耗及温度测试
功耗测试中,我们选择FurMark2软件进行拷机测试,并采用AIDA64检测信息。
FurMark软件截至目前,尚无法检测到GPU信息,部分温度识别有误。我们主要看蓝色的AIDA64信息。AORUS Geforce RTX 5080 MASTER 16G在1小时左右的烤机测试中GPU温度为71℃;显存温度为70℃。另外可以看到在TDP 100%的满载情况下,整卡功耗为360W。
除了满载烤机,我们也实测了游戏中显卡的真实数据表现。测试选择《赛博朋克2077》benchmark,4K分辨率下光追加速画质,并开启DLSS 4 4X多帧生成,将显卡性能拉满。
可以看到AORUS Geforce RTX 5080 MASTER 16G的平均功耗为328W。
进行功耗检测的同时,我们也调出了延迟数据,在DLSS 4 4X多帧生成的环境下,游戏平均延迟为63ms左右。证明即便有多张AI生成帧参与到游戏中,我们依然能获得比较“跟手”的操作体验。
12 DLSS 4让帧数突破显示极限!
在RTX 50系NVIDIA Blackwell架构中,大家可以明显感受到内部结构的调整,不仅仅是简单的CUDA数量增加、FP算力增强。NVIDIA让更多的计算单元或引擎,均开始为AI“服务”,让算力成为AI模型的后盾。这一点其实与此前所有的GPU均不同,包括NVIDIA自己的RTXGPU。
如果说RTX 30系和RTX40系显卡是靠硬件算力来推动AI工作,那么RTX 50系显卡的硬件算力则成为了AI应用的“保障性”条件,一切的改变都是为了让AI有更充足的“后盾”。而相辅相成的,AI技术的应用,也让计算有了更低的开销。
其中最显著的就是DLSS 4的多帧生成,在仍保持较低延迟的体验中,帧数能够提升数倍。本次DLSS 4之所以有如此大的改变,除了架构本身的变动,另一方面则是从CNN替换到Transformer模型,让AI从中发挥更多作用,不再只是单纯的计算,更利用AI的长处,做到宏观把控,进一步增强生成帧的稳定性和质量。
并且从长远来看,后续70和60级别的产品,凭借DLSS 4的多帧生成,都可以做到暴力的越级体验。让主流显卡体验2K或4K高帧游戏不再是梦想。
而从显示器行业的角度来说,过去高分高刷显示器的性能严重过剩,几乎没有游戏能碰到上限。但随着DLSS 4的推出也鞭策着显示器行业有了更大的进步空间。至少从理论测试来看,8K 150帧已经不是问题了。
除了游戏方面,FP4运算的引入,也让内容创作进一步提速。更少的显存需求、更快的运算速度,以及无可挑剔的生成质量,都可以让过去常规的任务,提速增量。而对于规模更大的项目,也让不可能变为可能。
本次评测的AORUS Geforce RTX 5080 MASTER 16G是技嘉旗舰系列显卡,坦白讲,外观设计相比RTX 40系顺眼了许多,虽然仍然都是黑色,但整体的层次感和小装饰,起到了画龙点睛的作用。
另外则是随卡附带的散热风扇,虽然此前也有类似的设计,但更多的还是装饰意义较大。而AORUSGeforce RTX 5080 MASTER 16G这个散热风扇则是实打实的好用。满载烤机温度59℃,对于一张RTX 5080而且是高频率的显卡来说,简直是奇迹。通常只有采用水冷散热才能达到这个效果。
可能有玩家会觉得,这个风扇装上去没有那么美观,但它方便的地方就在于可以随时拆卸,而且风扇针脚和灯光针脚都可以热插拔,日常使用高温的情况下救急也是非常方便的。
本次评测的AORUS Geforce RTX 5080 MASTER 16G显卡已经在技嘉各大官方电商有售,想率先体验DLSS 4的爆炸性能,可以关注一下。
(9470214)
技嘉RTX 5070超级雕评测:DLSS 4让中端显卡也有顶级游戏体验
一、前言:RTX 5070能让主流玩家满意吗?
NVIDIA RTX 50系列显卡中定位于中高端的RTX 5070终于登场,相比上一代的RTX 4070最大的升级之处就是Blackwell架构带来的DLSS 4技术。
DLSS这种利用AI性能提升帧率的技术,可能会有玩家觉得是一种“作弊”,是性能不足时的一种“取巧”,不太瞧得上,但不得不承认,DLSS技术确实能大幅提高游戏帧数,帧数提升是真的会让游戏变流畅。
技嘉AORUS GeForce RTX 5070 MASTER显卡(以下简称技嘉RTX 5070超级雕)现在已经来到了我们快科技评测室,就让我们看看新一代的RTX 5070能不能让游戏玩家满意吧。
技嘉RTX 5070超级雕搭载了NVIDIA Blackwell架构GPU,核心编号BG205-300,核心包含48组SM单元、6144个CUDA核心(流处理器),另外还有192个第5代Tensor Core张量核心、48个第4代RT Core光追核心,支持PCIe 5.0接口,12GB GDDR7显存拥有192bit位宽和672GB/s的带宽。
标称核心频率来到2.33-2.51GHz,整卡TGP为250W,技嘉还为其准备了两套BIOS设置,通过一个小开关控制,用户可以在性能和静音之间自由切换。
技嘉RTX 5070超级雕显卡的详细配置如下:
二、外观图赏:家族式全黑设计 没有附带额外风扇略遗憾
技嘉RTX 5070超级雕显卡外包装保持了技嘉一惯的特色,正面大面积黑色设计。
中间是3D金属质感的AORUS大雕LOGO和MASTER字样,左下角标明了技嘉风之力散热系统,出厂预超频版本和四年质保,底部到右下角是NVIDIA标志性的绿色线条和GeForce RTX 5070。
包装盒背面则是比较详细底介绍了技嘉RTX 5070超级雕显卡的散热系统设计以及NVIDIA RTX 50系的新特性。
技嘉RTX 5070超级雕显卡正面被三个硕大的风扇占据,技嘉的风之力散热系统使用三枚正反转安装的仿生风扇。
扇叶上设计有齿形边缘,并在表面增加了线形纹理和凸点,有效降低了风阻和风噪,同时增加了风压和风量,提高散热效率。
全黑的显卡散热器外壳,在风扇边缘处印有彩色线条图案,和技嘉在风扇扇叶上搭载的RGB炫彩光轮相呼应。
金属背板上印有技嘉AORUS大雕的LOGO和光芒状的放射线条,在显卡尾部背板有一个巨大的不规则散热窗口。
之前我们评测过的技嘉RTX 5080超级雕显卡,在这里可以安装第四枚辅助散热风扇,但技嘉RTX 5070超级雕250W的功率并不很需要额外的风扇,但我们仍然希望技嘉能提供可选方案让需要的用户自行购买额外风扇辅助散热。
显卡背板上大雕Logo图案特写。
显卡尾部散热窗口特写,可以看到散热器中密集的鳍片和穿插其中的热管。
技嘉RTX 5070超级雕顶部特写,散热器外壳的顶部是一条镜面装饰条,印有GEFORCE RTX 字样和AORUS的RGB Logo灯。
顶部有三分之二厚度是镂空的,散热鳍片直接暴露在外,非常有利于散热。
技嘉RTX 5070超级雕顶部的AORUS RGB Logo灯特写。
技嘉RTX 5070超级雕的挡板也设计有大量镂空,可以直接看到散热鳍片和热管。这个角度可以清楚的看到技嘉RTX 5070超级雕显卡厚度是标准的三槽规格,高度也比挡板高出不少。
技嘉RTX 5070超级雕显卡提供了三个DisplayPort 2.1b接口和一个HDMI 2.1b接口。
取下之后的显卡散热器,GPU核心、显存和供电部分都有硅脂确保和真空腔均热板或散热器主体良好接触,10根热管将热量传导至散热鳍片上进行高效散热。
技嘉RTX 5070超级雕的PCB全貌,金色的视频接口非常亮眼。
PCB中心是GPU芯片,旁边紧挨着放置了六枚显存颗粒,GPU核心上面还有两个显存空焊位,供电部分同样是分布在显卡两端。
技嘉RTX 5070超级雕PCB单面设计,背面没有布置主要元件,非常干净。
GPU芯片特写,芯片型号为GB205-300。
来自三星的GDDR7显存颗粒,一共六枚组成12GB的容量,不知道将来会不会有填补上那两个显存空焊位的16GB显存版本出现。
显卡尾部供电部分特写,可以看到布置在电源接口旁边的双BIOS切换开关。
显卡前部供电部分特写,镀金的视频输出接口非常华丽。
三、理论性能测试:稳步进步 较RTX 4070提升30%
测试平台配置如下:
1、Speed Way
在3DMark测试综合性能的Speed Way测试中,技嘉RTX 5070超级雕显卡的总成绩为5959,其中显卡测试成绩为59.60FPS。
2、Steel Nomad
在3DMark中测试可靠性、稳定性和持续性能的Steel Nomad测试中,技嘉RTX 5070超级雕显卡的总成绩为5115,其中显卡测试成绩为65.19PS。
3、Port Royal
在3DMark中测试实时光追性能的Prot Royal测试中,技嘉RTX 5070超级雕显卡的总成绩为14427,其中显卡测试成绩为66.79FPS。
4、Time Spy
在3DMark的Time Spy(DX12+2K渲染分辨率)测试中,技嘉RTX 5070超级雕显卡的总成绩为23010,其中显卡分数为22924。
5、Time Spy Extreme
在3DMark的Time Spy Extreme(DX12+4K渲染分辨率)测试中,技嘉RTX 5070超级雕显卡的总成绩为11281,其中显卡分数为10927。
6、Fire Strike
在3DMark的Fire Strike(DX11+1080P渲染分辨率)测试中,技嘉RTX 5070超级雕显卡的总成绩为44176,其中显卡分数为56596。
7、Fire Strike Extreme
在3DMark的Fire Strike Extreme(DX11+2K渲染分辨率)测试中,技嘉RTX 5070超级雕显卡的总成绩为28389,其中显卡分数为29132。
8、Fire Strike Ultra
在3DMark的Fire Strike Ultra(DX11+4K渲染分辨率)测试中,技嘉RTX 5070超级雕显卡的总成绩为14867,其中显卡分数为14390。
理论性能测试成绩汇总如下:
技嘉RTX 5070超级雕显卡的理论性能测试成绩比上代同级的RTX 4070提升了约30%,对比RTX 4070 Ti也有5%以上的进步。
做为一款定位于中高端的显卡,RTX 5070的性能比更高一级的RTX 5070 Ti有大约15%的差距,考虑到价格差距更大,RTX 5070的性价比更好一些。
四、DLSS 4性能测试:在RTX 5070身上更有价值
NVIDIA最新的RTX 50系显卡使用的Blackwell架构,最大的变化就是带来了全新的DLSS 4多帧生成(MFG)技术,基于AI模型,在常规渲染帧之间插入AI生成帧,而且最新的DLSS 4可以一次为一个渲染帧额外生成三个AI生成帧,极大的提高了帧率。
全新帧生成AI模型代替硬件光流加速器来加速光流场的生成,速度提高了40%,显存占用降低了30%,最高可以通过AI生成16个像素中的15个,极大地提高的画面流畅度。
我们测试了《赛博朋克:2077》、《霍格沃兹之遗》、《心灵杀手2》和《星球大战:亡命之徒》,看看DLSS 4在实际游戏中的效果如何。
为了体现DLSS 4对游戏帧数的提高带来的额外流畅性,所有的游戏都是在最高画质和4K分辨率下进行的测试。
1、《赛博朋克:2077》
在《赛博朋克:2077》中,我们使用“光线追踪:超速”预设,并在DLSS中选择Transformer模型,DLSS超分辨率使用默认的自动,分别以不同的插帧级别,运行自带的性能测试。
使用Transformer Model时,《赛博朋克:2077》关闭DLSS、启用DLSS 2X、DLSS 3X和DLSS 4X测试帧率分别为:39.81、67.47、94.64和118.84,可以看到使用DLSS 4 4X时最高帧率提升可达298.52%。
2、《霍格沃兹之遗》
在《霍格沃兹之遗》中,使用4K分辨率超高画质,DLSS超分辨率设置为平衡,记录不同插帧级别时的游戏帧数。
《霍格沃兹之遗》在关闭DLSS、启用DLSS 2X、DLSS 3X和DLSS 4X测试帧率分别为:58、139、189和230,可以看到使用DLSS 4 4X时最高帧率提升可达396.55%。
3、《心灵杀手2》
在《心灵杀手2》中,使用4K分辨率和最高画质,记录不同插帧级别时的游戏帧数。
《心灵杀手2》在关闭DLSS、启用DLSS 2X、DLSS 3X和DLSS 4X测试帧率分别为:11、23、35和46,可以看到使用DLSS 4 4X最高帧率提升可达418.18%。
4、《星球大战:亡命之徒》
在《星球大战:亡命之徒》中,使用4K分辨率和超高画质预设,图像采样质量设置为质量,记录不同插帧级别时的游戏帧数。
《星球大战:亡命之徒》在关闭DLSS、启用DLSS 2X、DLSS 3X和DLSS 4X测试帧率分别为:49、83、116和143,可以看到使用DLSS 4 4X时最高帧率提升可达291.84%。
DLSS 4游戏测试数据汇总如下:
DLSS 4对帧数的提升在RTX 5070这个级别的显卡上,带来的流畅体验比更高级别的RTX 5080和RTX 5090 D都要强烈。
DLSS 4在游戏中对帧数的提升比例和显卡本身的级别定位关系不大,RTX 5070一样可以让帧数提高最多4倍。
以《赛博朋克2077》为例,本身以RTX 5070的性能,4K特效全开的情况下只能跑到40fps左右,运行并不算流畅,但在DLSS 4技术的加持之下,4K特效全开甚至能跑到接近120fps,可以说是非常流畅了。
五、其他4K游戏测试:黑神话也可保证60pfs流畅运行
1、《黑神话·悟空》
在《黑神话·悟空》中,4K分辨率+影视级画质下测试,使用DLSS超分辨率,采样精度50,启用帧生成功能,测试成绩为平均帧率61帧/秒,最低52帧/秒,95%帧率高于55帧/秒。
2、《极限竞速:地平线5》
在《极限竞速:地平线5》中,使用4K分辨率极端画质测试,最终测试成绩为149fps。
3、《战争机器5》
在《战争机器5》中,使用4K分辨率超高画质测试,最终测试成绩为76.5FPS。
4、《地平线:零之曙光》
在《地平线:零之曙光》中,使用4K分辨率和终极质量画质测试,最终测试成绩为136fps。
5、《古墓丽影:暗影》
在《古墓丽影:暗影》中,使用4K分辨率和最高画质测试,DLSS超级采样设置为平衡,平均帧率为152。
6、《怪物猎人:荒野》
在《怪物猎人:荒野》中,使用4K分辨率和极高画质测试,打开帧生成功能,最终测试成绩为81.9帧。
其他4K游戏测试成绩汇总如下:
在不支持DLSS 4技术的游戏中,RTX 5070的表现符合它的定位,绝大多数游戏中4K特效全开也都是可以非常流畅的运行的。
只有《黑神话·悟空》对性能要求极高,RTX 5070性能正好踩在60帧的及格线上,比RTX 4070必须降低分辨率或者超采样精度才能流畅运行好了不少。
六、AI和生产力测试:视频编辑性能提升巨大
1、Procyon:视频编辑性能
我们使用Procyon测试工具中的视频编辑性能测试项目对技嘉RTX 5070超级雕显卡进行测试,开启Procyon中的硬件加速选项后,就可以让Adobe Premiere Pro软件充分利用RTX 5070 GPU的硬件编解码性能,最终测试成绩为59940。
2、Blender Benchmark
Blender是一个免费的3D建模渲染工具,它提供了一个测试程序可以用来对显卡的性能渲染性能进行测试,在Blender Benchmark中提供的三个渲染场景中,技嘉RTX 5070超级雕显卡的得分别为:30521.862388、1697.087159和1609.528568。
3、V-Ray Benchmark
V-Ray是一款计算机图像渲染软件,它能够提供精细的光照、全局照明、镜头失真模拟等核心功能,并且支持CPU和GPU渲染,可以制作出照片级别的渲染效果。此外,它还作为引擎被maya等3D建模渲染工具所使用,拥有相当广的使用场景。
在针对显卡的V-Ray GPU RTX测试项目中,技嘉RTX 5070超级雕显卡得分为6759。
4、Procyon:文本推理性能
Procyon中的AI Text Generation Benchmark项目是一个简化本地 LLM AI 性能测试,提供了PHI 3.5、MISREAL 7B、LLAMA 3.1和LLAMA 2四个不同参数大小的行业标准 AI 模型轻松快速地进行测试。
技嘉RTX 5070超级雕显卡在测试中四个模型的得分分别是3340、3484、3567和2764。
技嘉RTX 5070超级雕显卡生产力和AI性能测试数据汇总如下:
技嘉RTX 5070在生产力测试中比上代的RTX 4070成绩提升接近四分之一,特别是在视频编辑性能测试中,全新的编码器和解码器让RTX 50系列的视频编辑能效有跨越式的进步,测试成绩对比更高一级的RTX 4070 Ti都有接近30%的提高。
七、烤机和温度:250W烤机不到64度 核心频率最高2.86GHz
我们使用Furmark对技嘉RTX 5070超级雕显卡进行10分钟的烤机,室温约22度,GPU功耗稳定在250W,核心频率2392MHz,温度63.7度,风扇转速2050RPM。
我们使用3DMark进行压力测试,连续运行20轮的Speed Way测试场景,运行期间技嘉RTX 5070超级雕显卡核心频率最高加速至2865MHz。
最终测试成绩稳定性为99.1%,最佳成绩和最差成绩之间的差距非常小,帧率曲线上几乎完全重合,在长时间工作下技嘉RTX 5070超级雕显卡的性能几乎没有波动,运行非常稳定。
八、总结:RTX 5070让主流玩家也能享受高端体验
技嘉RTX 5070超级雕定位于中高端,但在游戏中的表现可不止于此。
虽然实际性能提升对比上一代的RTX 4070并不算夸张,黄氏刀法依旧精准,但是在DLSS 4技术的加持之下,以往只有顶级显卡才能享受的4K最高画质,现在主流玩家也可以体验到了。
技嘉RTX 5070超级雕在理论性能测试中比上一代的RTX 4070成绩提高了约三分之一,和更高一级的RTX 5070 Ti的成绩差距还有15%左右,正好可以在我们测试的《黑神话·悟空》4K影视级画质下跑到及格的60帧,RTX 5070的实际性能进步也是正好踩在了一个台阶上。
RTX 5070能让4K游戏从此成为主流,可能等到RTX 5060这个级别的显卡上市之后,2K游戏只能算是入门了。
虽然有很多玩家不喜欢近乎“作弊”的DLSS技术,但不得不承认这种通过AI技术获得的帧数也是实实在在的帧数,也能让游戏变得更加流畅。
以往要想体验3A大作在4K分辨率下特效全开的精美画面,一块顶级显卡是必不可少的,但绝大多数的主流玩家只能选择降低分辨率,甚至关闭部分特效才能流畅运行,所以才有一代又一代的“显卡杀手”游戏。
现在有了最新的DLSS 4技术,在RTX 5070这个级别的显卡上本来只能跑到40帧的《赛博朋克2077》,也能以120帧的速度流畅运行,又有几个玩家能忍住不体验一下这个级别的精美和流畅的画面呢?
AI技术迅猛发展的今天,DLSS这种通过AI进行帧生成的游戏技术就是未来的发展方向,将来支持类似技术的游戏只会越来越多越来越好,不会再有玩家因为显卡性能问题被迫放弃某款游戏了。
最后顺带一提,技嘉还提供一款RTX 5070 WindForce风魔版,保持在建议零售价4599元,玩家可按需选择。
关于GIGABYTE-gigabyte界面无法开机的内容到此结束,希望对大家有所帮助。
用户评论
病房
我的 Gigabyte 机子前几天也这样了!还好我及时看到了你们的帖子,现在正在搜索解决方法,希望能快点修好。
有11位网友表示赞同!
断秋风
别急啊,我也是 Gigabyte 用户,之前出现过类似的问题,可能是固件出问题的。网上可以找到很多教程,试试看更新一下固件或许能解决
有17位网友表示赞同!
别伤我i
GIGABYTE 的界面是真的很美观,可惜这回我的主板进不去系统了,只能用其他电脑发帖求助了!大家帮忙点个赞,让论坛管理看到吧!
有14位网友表示赞同!
将妓就计
我之前买 Gigabyte 的主板可是花了大价钱的啊!结果现在开不了机,客服电话都不接!真后悔选这个品牌。这可不是小问题!
有8位网友表示赞同!
野兽之美
我建议联系 Gigabyte 官方技术支持吧,他们应该有专业的解决方案来处理你的问题。别自己瞎捣鼓可能会弄坏设备。
有12位网友表示赞同!
岁岁年年
我的 gigabyte 主板也是这样,明明昨晚还能用,今天早晨就开不了机了。感觉这个品牌的质量真的可以用 “忽悠” 来形容!
有12位网友表示赞同!
还未走i
我也遇到过类似的问题,可能是你的电源连接有问题或者硬盘连接没稳固。检查一下硬件连接是否通畅再试试看。
有11位网友表示赞同!
呆萌
Gigabyte 主板确实好用,但这种问题确实让人头疼。我之前遇到过,后来是换了新的 CPU 成功的解决问题的,可以考虑尝试看看
有19位网友表示赞同!
太易動情也是罪名
我的电脑是 Gigabyte 组装的,平时用起来蛮流畅。 现在突然开不了机真是太难受了。 求解!
有13位网友表示赞同!
堕落爱人!
我也是 Gigabyte 主板用户,之前就听说这类问题存在,看来我得多注意保养机器了
有12位网友表示赞同!
∞◆暯小萱◆
gigabyte的主板一直都很容易出毛病呀,我已经更换了几次主板了。
有13位网友表示赞同!
清羽墨安
有没有人知道这个界面无法开机的解决方法?我的电脑是gigabyte生产的,急需帮忙!
有17位网友表示赞同!
经典的对白
我试过了各种方法,还是不行, Gigabyte 的售后服务态度还可以吧,但他们说还需要去寄维修。好麻烦啊。
有16位网友表示赞同!
心悸╰つ
看来gigabyte的主板质量不太理想呀, 之前用其他品牌也一直没出现过这种情况!
有12位网友表示赞同!
青衫故人
这种问题应该不是软件原因吧?我的 Gigabyte 主板硬件配置都挺好的,不会是坏了吧?
有10位网友表示赞同!
残花为谁悲丶
别担心,我记得网上有人说 gigabyte 面对面维修服务挺好,你可以去看看官方网站上有没有相关的信息 ,或许能够帮你解决问题!
有14位网友表示赞同!
安陌醉生
我也遇到了 Gigabyte 的界面无法开机的问题。 网上资料不太多。 希望大家能互相帮助解决这个问题吧
有15位网友表示赞同!