尝试过:AMD Radeon HD 7870/7850 - 危险的斗牛犬
GCN 架构的首批代表,即 AMD Radeon HD 7970 和 HD 7950 已经推出。 大溪地已被证明,但现在这里是皮特凯恩,它以更实惠的价格专门针对渴望高性能的玩家。 它们是 Radeon HD 7870 和 HD 7850。这两个型号来自技嘉和华硕,因此除了各种测量和调整之外,我们还查看了 CrossFireX。 让我们开始吧!
AMD Radeon HD 7800 - 游戏玩家的梦想?
如果我们想用尽可能简短的方式来描述 Pitcairn 芯片,我们只会说 Graphics Core Next (GCN) 架构已经突破到顶端。 该磁贴从技术和用户的角度显示了出色的参数,因此它绝对值得几行,但让我们先回顾一下过去。
2009年底,2010年初,AMD Evergreen系列开始征服。 该产品系列在半年内完成,并建立在四个图形处理器上。 当时,看起来这将是一个难以超越的步伐。 我们现在知道,与南部群岛家族相比,这是一次步行疾驰。 该公司在短短 3 个月内就推出了三款 GPU,使其能够同时攻击中产阶级和上层阶级。 现在让我们熟悉最后一块拼图。
以一种突破性的方法,让我们将两个佛得角 GPU 组合在一起。 如此获得的混合物称为皮特凯恩。 这让事情变得有点复杂,我们也想偿还旧债。
得益于台积电的 28 纳米制造技术,皮特凯恩实现了残酷的晶体管密度,每 212 平方毫米有 2,8 亿个晶体管。 Radeon HD 7800系列最强大的成员隐藏了20个GCN阵列,相当于总共1280个流处理器。 与大溪地和佛得角瓷砖相比,这大约是一半,但我们会看到皮特凯恩更像它的大哥——前端和后端都是很好的例子。 该芯片接收两个光栅和两个几何电机。
后者与之前的解决方案没有太大区别,但是,工程师进行了多项优化,从而提高了性能和效率。 两个第九代曲面细分器单元当然能够并行工作。 顺便说一下,他们的工作是由一个单独的缓冲区促进和加速的。 由于这一点,以及一些小的改进,Radeon HD 7800 可以在镶嵌过程中残酷地羞辱 HD 6900 系列。 有了这个,我们基本上设法达到了与 NVIDIA GeForce GTX 500 系列相同的水平,这非常重要,因为该领域的竞争对手并没有节省多少晶体管。 关于前端,我们还应该提到 Command 处理器,它负责负载均衡和调度。
每个 CU(计算单元)有四个纹理器,因此完整的 Pitcairn GPU 可以分别管理总共 80 个纹理器和 320 个 Load-Store 单元。 尽管与 Tahiti 图形处理器相比存在重大挫折,但这些似乎是最佳值。 组件层次结构忽略了根本性的创新和变化,但这并不是真正必要的。
由于 AMD 主要希望通过 Radeon HD 7800 系列满足游戏玩家社会的需求,Pitcairn 开始对图形处理器进行重大清理,因为 GPGPU 应用程序下的性能不再是这里的重要因素。 二级缓存大小从2MB下降到512Kbyte,峰值算力从947 GFLOP/s下降到160 GFLOP/s双精度。 这对老大哥来说是一个重大的挫折,但对于NVIDIA GK104处理器来说已经不是了,因为它也有类似的技术特性。 无论如何,GPU 非常熟悉 DirectCompute 11.1、OpenCL 1.2 C ++ AMP API,因此无需担心。 在官方营销材料中看到比平常更奇怪的信息。 据该公司称,现在是用 AMD Radeon HD 5800 成员取代 ATi Radeon HD 7800 系列控制器的时候了。 诚然,之前的系列已经不能称得上是显卡之王了,但无论我们怎么扭扭扭捏,即使是这样的变化,也是一个奇怪的步骤。 从理论上讲,闲置消费存在显着差异,但营销人员在两个极端情况下都略有下滑,因此在严峻的条件下,我们会看到不同的画面。 Cypress 芯片的主要弱点是 tessellator 单元,但目前在一些游戏中遇到了这种情况。 出于显而易见的原因,我们不会评论 PCI Express 3.0 接口的好处。 最后留下了3D Mark 11。显然,这个选择是可以的,因为这里的差异可能更显着。 在这个综合测量程序中,我们可以谈论大约 30% 的差异。 看着刚刚超过 100 万福林的价格标签,这一切都没有说服力。 在性能方面,我们完全不建议切换,无论 AMD 多么想要。
回到建筑解剖。 最大的惊喜出现在后端区域。 Pitcairn 包含 8 个 ROP 集群,与 Tahiti 的方式相同。 这些“阵列”中的每一个都包含四个 ROP 单元和 16 个 Z 采样器,因此在 HD 7870 1 GHz 的工作频率下,一秒内计算的像素数发展非常顺利。 纸张界面已经进入内存界面。 四个 64 位内存控制器的总容量为 256 位。 默认视频内存大小为 2048 MB。 4GB 的套餐理论上也是可行的,但意义不大。 强大的后端能力可以创造非常有趣的情况。
当然,Pitcairn 有 DirectX 11.1、PCI Express 3.0、Eyefinity 2.0 和 Zero-Core 支持。 后一种程序尚未由 NVIDIA 实施,尽管由于采用 ZeroCore 技术,在显示器关闭的情况下,整个图形控制器可以断电,并且这种形式不需要主动冷却。 好处是令人信服:零噪音,3 瓦的功耗。 由于几乎完美的平衡,消费指标发展良好。 对于 Radeon HD 7870,PowerTune 限制为 190 瓦,而典型功耗为 175 瓦。 该卡在 10W 以下空闲,3W 也可通过 ZeroCore 获得。 GHz 版标志也可以在这里找到,它旨在表明产品已达到 1 GHz 的工作频率。 Radeon HD 7850 也不丢人。 控制器的最大功率要求为 150 瓦,但通常最高可达 130 瓦。 由于参数相似,闲置消耗可能大致相同。
由于在我们的 Radeon HD 7970 和 HD 7950 文章中没有时间详细说明一个重要区域,这就是 PRT(部分共振纹理),即硬件虚拟纹理。 今天的图形处理器在处理大量纹理方面非常头疼。 当玩家从轨道的一个部分移动到另一部分时,CPU、图形卡和数据存储会被捕获以进行连续工作。 因为您必须处理大量信息,所以很容易发生加载不顺畅的情况——我不需要详细介绍 Rage。 AMD 希望通过 hussar 削减来解决这个问题。 解决方案非常简单,但很棒。 重点是把显卡的VRAM当作一个纹理缓存系统。
即将使用的纹理在应用之前应该先加载到显存中,这样就已经解决了问题。当 GPU 想要使用数据时,它可以快速访问数据(出于可以理解的原因)。从某种意义上来说,这可以被认为是一种纹理“流化”过程。因此,PRT 动态加载选定的纹理,因此即使对于大文件也可以避免带宽占用。不幸的是,给定游戏的图形引擎必须为此单独准备。我们可以确定《毁灭战士 4》将支持部分驻留纹理 (PRT) 实现。约翰·卡马克可能已经在喝着香槟等待这一刻了,考虑到《Rage》奇怪的图形异常,我们也以同样的热情接受了它。
UVD 3.0 还为 DivX/Xvid、MPEG-4 Part 2 MVC 内容提供硬件加速,而视频代码引擎 (VCE) 是 AMD 对等的 Intel Quick Sync Video。 VCE 是独立硬件,仅用于加速 H.264 视频的转码。 引擎比图形处理器中的着色器处理器慢,但更节能。 有两种模式可供用户使用。 起初,只有 VCE 有效,它本身比大多数 CPU 都快。 在这种情况下,我们不会遇到减速,我们可以毫无问题地加载视频卡或中央单元。 第二种选择是混合模式。 VCE 和 GPU 的算术逻辑单元一起跳转到任务。 这种“联姻”显然对编码速度有很好的影响,但在这种情况下,如果您最喜欢的游戏切换到“幻灯片”模式,请不要感到惊讶。 现在很高兴能够准确地了解系统在恶劣条件下的能力,但如果没有正确的支持,它甚至会更远。
Eyefinity 2.0 的有趣之处之一是它允许您使用多轨音频进行多显示器电话会议。 该程序的正式名称是离散数字多点 (DDM) 音频。
在对架构进行了简要介绍之后,我们现在正在涉足其他领域。 自Southern Islands 系列推出以来,AMD 一直在不断努力提升游戏中所达到的图像质量。 第一个重大更新涉及 Radeon HD 7900 系列控制器。 DirectX 10和DirectX 11下SSAA(Super-sampling Anti-Aliasing)抗锯齿的出现绝对是一个令人欣喜的现象。 在后来的 Catalyst 驱动器中,AutoLOD 算法可以进一步提高图形质量,但这还不是全部,因为与此同时,程序员已经在研究 MLAA 2.0 程序。 Tom's Hardware 和 Anandtech 的测量结果证实了新解决方案的速度明显快于其前身。 另一个好消息是(在纸面上)它可以从 Radeon HD 4000 系列中使用。 判断图像质量是主观的,但总的来说,我们似乎也设法继续前进。 故事的第二集是改进的各向异性滤波器算法。 这在理论上完全消除了我们之前经历过的闪烁、颤抖和其他异常现象,这听起来很不错——我们不会因此而服用毒药。 否则,新算法不需要额外的缓冲,因此不会增加系统资源的负担。
无论是第二眼还是第三眼,我们不得不说皮特凯恩芯片已经变得非常平衡。 由于优化,芯片的尺寸和功耗得到了有利的发展,这实际上导致 Radeon HD 7950 在外壳内获得了最强大的竞争。 AMD 严重削弱了较小的基于 Tahiti 的卡,它可能已经完全失去了以前的受欢迎程度。 这似乎是一个有趣的步骤,但回想起来,GK104 已经成为真正成功的游戏玩家芯片是有道理的。 双方的工程师都给出了他们最好的知识。 Pitcairn 留有回旋余地,因为建立在其上的卡片可产生相当好的性能水平,同时制造成本处于有利水平。 GK104 的不同变体产生更高的速度,但生产成本更高。 AMD 只是需要这样的芯片,因为 Tahiti 已经向 GPGPU 发展了很多,以至于它已经可以在游戏玩家线上被击败。
该公司的产品编号现在演变得有点奇怪。 Radeon HD 7800 系列似乎比 HD 6800 有了明显的改进,使 HD 7870 和 HD 7950 几乎处于同一级别。 另一方面,与 HD 7700 系列相比,Radeon HD 6700 在性能方面并不是一个大爆炸,尽管后者只是重命名的结果。 在实践中,近两年半的瞻博网络 GPU 的表现仅比佛得角高出 20%,我们承认这根本不是令人信服的进步。