我们测试了 GK104:GeForce GTX 680 和高端枪
是时候了! 我们等了很长时间,从很多地方听到了很多关于它的消息,但最终NVIDIA的架构称为Kepler,可以认为是Fermi的继任者。 或不? 在我们的文章中,我们不仅在技术方面进行了修复,当然我们还描述了代号为GK104的GeForce GTX 680卡的精神世界描述的所有功能,除了消耗和升温之外,我们还进行了性能多方面测试。 让我们切入其中!
技术
到目前为止,人们的共识是,从长远来看,GPU 的整体计算能力比三维游戏中表现出的速度具有更高的价值。 这一趋势对 NVIDIA Fermi 显卡产生了重大影响,然而,第一款 Kepler 芯片打破了这一原则。 是否值得采取这一步将在几页中清楚地显示出来。
认识 GK104 GPU
GeForce GTX 680 显卡基于前面提到的 GK104 图形处理器。 该芯片采用台积电 28nm 制造技术制造,尺寸为 294 平方毫米,由 3,54 亿个晶体管组成。 与AMD代号为Tahiti的解决方案相比,这是一个相当不错的价值——主要体现在生产成本上。 GPU最引人注目的参数是1536 CUDA核心,是GeForce GTX 580的三倍。 芯片本身有 4 个 GPC(图形处理集群),其中装有两个 SMX(着色器多处理器)。 SMX 包括一个 PolyMorph 2.0 引擎、一个指令缓存、192 个 CUDA 内核、16 个纹理器,当然还有一级缓存。 在这里我们要注意,到目前为止使用的Shader时钟已经成为过去,所以现在芯片的所有组件都遵循相同的频率,这在调度方面实际上是一件好事。
[]
以 NVIDIA 模式保存
根据过去的经验,我们可以看到,构成新加农炮基础的芯片现在具有令人惊讶的有利物理参数。 与 GeForce GTX 280、480 和 580 卡相比,新手在完全不同的类别中移动。 我们现在将简要介绍工程师控制晶体管数量和芯片尺寸的发展和创新。
[]
每个着色器多处理器都拥有一个曲面细分器单元,这意味着总共有 8 个处理器。 如果单看数字,我们可能会认为在这一点上与上一代相比有所退步,但由于曲面细分器的性能翻了一番,总体而言,肯定会有进步。 最大的变化是在后端。 GK104 GPU 通过 256 位内存总线访问 2GB 的 GDDR5 板载内存,内存芯片的有效频率为 6,0 GHz。 这在实践中意味着什么? 与GeForce GTX 580相比,内存总线的宽度减半,但这已经被令人毛骨悚然的内存时钟完全抵消了。 这也是一个巨大的轻弹,因为 AMD 曾经在这一点上处于不同的维度,但现在 Radeon HD 7970 已经被半 GHz 超越了。 优化 ROP 单元的数量也不是显着的节省。 到目前为止,作业是五星级的,但现在来了黑汤。
尽管 GeForce GTX 680 具有极其广泛的 API 支持(CUDA C、CUDA C++、CUDA Fortran、OpenCL、DirectCompute 和 Microsoft C++ AMP),这些确实是通用可编程性的关键,但有几件事仍然非常重要少了很多。 双精度计算能力是 GPGPU 市场的一个重要因素,适用于富含性能密集型浮点计算的任务,但一般来说也是如此。 在这一点上,新的开普勒瓷砖可以受到非常严重的攻击。 该芯片理论上具有四分之二的双精度单精度计算能力,这立即在SiSoftware Sandra 2012测量程序中发挥作用。 GeForce GTX 680 甚至无法击败其前身,而 AMD Radeon HD 7900 系列则属于完全不同的类别。 为了进一步优化,工程师没有实现 ECC 和虚拟内存支持,并且各种缓存的大小都被限制在仍然可以接受的范围内,因此 GeForce GTX 580 的二级存储比新人多了一倍半。 主要是因为缺少硬件虚拟纹理,我们的心很痛,因为这样做会给图形处理器处理大量纹理带来严重的头痛。 我们很想知道在《毁灭战士 4》期间是否还会有另一个禁食。 GPGPU 性能将在下一页讨论。 前言是香槟值得放回冰箱。
不乏创新(即便如此)
当然,GeForce GTX 680 符合 PCI Express 3.0 标准,还支持 DirectX 11.1 和 NVIDIA GPU Boost 技术。 GPU Boost 程序允许自动设置核心时钟。 为确保性能始终处于理想水平,Kepler 芯片还考虑了图形处理器负载、功耗和当前温度,并相应提高了速度。 根据官方文档,时钟增加发生在 100 毫秒内,因此用户不会注意到任何事情。 实际上,这意味着 GK104 以 1006 MHz(核心基础)的基本速度运行,但在评估前几个因素后,芯片可以将其提升至 1110 MHz(核心提升)。 英伟达计算出GPU Boost的平均结果为1056 MHz,但在有利的情况下,确实可以捕捉到1,10 GHz。 开赛当天,我们在国外电脑网站上看到了这样的例子。 速度非常棒,所以难怪您已经设法接近之前的双头加农炮 GeForce GTX 590。 还可以设置 MSI Afterburner 和 EVGA Precision X 调整实用程序以获得最大性能和时钟偏移。
该公司希望为粉丝提供额外的独家功能,如帧率目标、自适应垂直同步和 NVENC。 第一个实际上只不过是可修改的 FPS 限制。 如果我们最喜欢的游戏以不必要的高速旋转,这可能是幸运的。 如果您想减少噪音排放和消耗,您可能需要考虑使用帧速率目标。
自适应垂直同步,或动态启用垂直同步,旨在保持稳定的速度。 当特定应用程序的速度低于显示器的刷新率时,您可能需要关闭同步以获得更好的性能。 该过程基本上实现了这一点——当然,无需用户干预。
NVENC 是一个固定功能单元,旨在加速 H.264 视频的编码。 在这里,应该预期的主要不是性能的显着提高,而是工作流程将以比以前少得多的能耗进行。 CyberLink MediaEspresso 已经准备好利用 NVENC。 与上一代相比,发展相当惊人。 根据德国 ComputerBase 的测量,GeForce GTX 680 的性能比其前身更快,功耗降低了 100 多瓦。
对于那些甚至没有足够的人,请查看 FXAA 平滑程序。 该算法基于 GK104 的高着色器性能。 FXAA 可实现与 4 倍 MSAA(多样本抗锯齿)类似的图像质量,但比率要高 60%。 不幸的是,AMD ZeroCore 降耗程序并没有以任何形式被纳入,但总的来说我们没有任何抱怨的理由。
[]
GeForce GTX 680 支持 NVIDIA 3D Vision Surround 技术。 幸运的拥有者最多可以使用四台显示器以获得更好的视觉体验。
简单回顾一下,我们可以说NVIDIA GeForce GTX 680并不是市面上最强大的单显卡,但2GB的显存在极高分辨率下可能会变得稀缺。 有传言说,Greens 甚至可能会在以后推出配备 4GB 板载内存的型号,但毕竟没有出现这种情况也没有问题。 合作伙伴已经完成了许多涡轮增压变体。
所用图块的编号证实了 GK104 代表了游戏玩家线,GF104 和 GF114 已经很好地接触了这一点。 因此,第一款基于开普勒的芯片在GPGPU应用下并不出色,但在游戏中却是无敌的,芯片尺寸和功耗一直很吸引人。 同时,这也反映出,AMD凭借GCN芯片,非常有针对性地针对专业需求,GPU的更广泛应用。 因此,基于 Tahiti 的显卡在大多数游戏中的性能低于使用 GK104 的 GeForce GTX 680。