推荐榜 短消息 big5 繁体中文 找回方式 手机版 广 广告招商 主页 VIP 手机版 VIP 界面风格 ? 帮助 我的 搜索 申请VIP
客服
打印

Phenom vs. Athlon 核心延展性比较!!

购买/设置 醒目高亮!点此感谢支持作者!本贴共获得感谢 X 2

Phenom vs. Athlon 核心延展性比较!!

Phenom 的时脉速度延展性如何?



[img]http://media.bestofmicro.com/V/V/110011/original/02Phenom.jpghttp://media.bestofmicro.com/V/V/110011/original/02Phenom.jpg[/img]


之前我们比较 AMD (超微) 的 Athlon 64 X2 与 Phenom 9000 四核处理器核心时,是强迫 Windows 只使用一个核心,以期了解 Athlon64 架构和 Agena/Barcelona 核心的 Stars 架构之间的真正效能差异。在特定效能测试时,拜 Phenom 的最佳化与 L3 快取之赐,单核对单核的 Phenom 显然真的比 Athlon 快了最高 20%。除了效能提升之外,Phenom 的统一四核设计与聪明的快取架构在高度执行绪化的情况下,应该能带来进一步的好处。这次我们并未审视使用所有处理核心时的效能差异,但读者可在 Phenom 的发表报导“Phenom 9700, AMD 第一款四核 CPU”中找到这些信息。包括与所有 Core 2 处理器比较在内的所有效能测试结果,则可以在我们的交互式 CPU 比较表中找到。

虽然核心对核心分析可以提供横跨一般效能测试的架构效能数据,但却无法回答 Phenom 的 TLB 问题修正 (B3 步进) 并以较高时脉速度量产后将会浮现的关键问题。问题很简单:AMD 四核延展性是否足以在高阶市场反击 Intel。换句话说:时脉速度的提升是否会进一步提升效能,或仅是像 Athlon 64 X2 时脉速度一样的等比例提升?而且在什么时脉速度之下,功耗将成为棘手的问题?

我们当然迫切得到答案,因此再次祭出我们的测试系统:采用 AMD 79FX 芯片组的 Asus (华硕) M3A32 MVP、Athlon 64 X2 6000+ 处理器、Phenom 9000 工程样品 (未锁倍频)、两条 1 GB DDR2-800 DIMM (Corsair)、我们的 Western Digital (威腾) 参考硬盘、以及 Gigabyte (技嘉) Radeon HD3850 参考绘图卡。我们以2.2、2.4、2.6 与 2.8 GHz 时脉速度来跑这两颗处理器,以观察时脉速度提升额外效能的程度。



简短的处理器历史教学






在 AMD64 于 2003 推出后及 Intel 于 2006 年引介 Core 微架构之间的大多数时段中,AMD64的设计一向是比 Intel 的 Pentium 4 或 Pentium D 产品来得优秀。当 Pentium 4 与 Pentium D 试图达到高时脉速度时,其耗电要求的成长幅度远大于其效能增益。因此,AMD 提供较高每时脉效能的方案显然更为成功。Intel 体认到,以现有制程技术在处理核心与时脉速度之间求取平衡,是以合理耗电要求带来更多效能的较合理途径,这个想法终于让 Intel 以 Core 2 Duo 重拾市场宝座。

在 Intel 将更多处理器单位塞进一个实体封装,以创造多核心处理器-例如 90 nm 的 Pentium D 800 与 65 nm 的 Pentium D 900-的同时,AMD 决定一开始就采取更为整合的方案。第一款 Pentium D 是在单一裸晶上安置两个 Pentium 4 单元,但它们是以前侧总线 (FSB) 来沟通。第二代的 Pentium D 900 则是纳入两个裸晶在实体处理器内。Athlon 64 X2 双核产品也包含两个 Athlon 64 核心,但却是位在单一裸晶上,AMD 同时也为每个处理器建置一纵横开关 (crossbar switch) 与共享内存控制器,因此核心与核心之间的沟通不会造成系统接口的负担-AMD 称为 HyperTransport,Intel 称为 Front Side Bus。

在推出 Core 2 Duo 后,Intel 终于将内含统一 L2 快取的两个处理器放在单一裸晶上,再加上其它改良,这就是 Core 2 产品系列带来领先的每瓦效能背后的秘密。由于将两个处理器裸晶置于单一处理器封装中以加倍核心数的作法较为方便,Intel 也用这种方法打造了 Core 2 Quad 处理器。基本上,Core 2 Quad 包含两个 Core 2 核心,而当单一个双核必须与另一双核心交换数据时,就再度仰赖前侧总线的帮助。

AMD 则坚持提供「真」四核,也就是现在的 Phenom 处理器。在 Intel 的 Core 2 Duo 采用一个共享式 L2 快取并以二个裸晶创造四核单元的同时,AMD 则更进一步为所有核心加上一共享 2MB L3 快取,并保留每个核心 512 kB L2 的快取。Intel 以 45 nm Wolfdale 核心为基础的下一代 Core 2 处理器,则是将 L2 容量增加 50% (6 或 3 MB 取代原本的 4 或 2 MB)。

虽然 AMD 可以更进一步控制诸如每个核心的时脉速度等等处理器特性,但 Agena/Barcelona 四核设计也必须高度依赖高生产良率。Agena 裸晶上的故障处理核心会迫使 AMD 将之打成三或双核心卖出,但 Intel 却拥有以任何两个 Core 2 裸晶打造四核单元的弹性好处。理论上而言,AMD 的确是较佳的四核设计,但 Intel 的策略更符合商业观点的合理性。不过我们最终还是着重在结果:产品是否能实现其原始宣称的效果?










2.2、2.4、2.6 与 2.8 GHz 的 Athlon 64 X2







本站的大多数读者应该相当熟悉 AMD 之前的 90 nm 双核处理器。第一批 Athlon 64 X2 双核处理器是在 2005 年六月以 2.0 到 2.6 GHz 的时脉速度针对 Socket 939 脚座推出 (2x 512 kB L2 快取的 Manchester 核心或 2x 1 MB L2 快取的 Toledo);这些产品后来又被 Socket AM2 版本取代 (2x 512 kB 或 2x 1 MB L2 快取的 Windsor F2 核心)。AMD 随着时间过去不断提升能源效率,并以 Windsor 的 F3 步进引介较高速的型号。当能源效率大幅改善的 65nm 版本 (2x 512 kB L2 快取的 Brisbane 核心) 于一年前推出后,它到现在仍无法达到 90 nm Windsor F3 的最高 3.20 GHz 时脉速度。这就是我们用在这次项目中的型号。

AMD 推出了两个版本的 Athlon 64 X2 6000+,它们都是跑 3.00 GHz 时脉并提供差不多的效能,其间的差别在于较新版的热设计功耗 (TDP) 为 89 W,而第一版则要求高达 125 W。我们手上的是较耗电的型号,不过这对这篇报导并无影响。

我们是用单一处理核心以 2.2、2.4、2.6 与 2.8 GHz 来执行效能测试。














2.2、2.4、2.6 与 2.8 GHz 的 Phenom 9000







AMD 以 Barcelona 设计 (Stars 核心) 的新处理器世代命运多桀。首先,它推出日期比原先承诺延后数个月,也无法达到反击 Intel 与其 Core 2 处理器大军的预期效能。不同于原先承诺的 3.00 GHz,目前的 Phenom 型号仅提供 2.2 与 2.3 GHz 版本 (Phenom 9500 与 9600)。2.4 GHz Phenom 9700、2.6 GHz Phenom 9900 和 2.3 与 2.5 GHz 三核 Phenom 型号 7600 与 7700 应该会在数周后跟进。

更为祸不单行的是,AMD 「衰」到目前的 B2 核心步进仍存在一个错虫 (bug)。它会影响 L3 快取的变换后备缓冲器 (TLB),并可能导致数据毁损与系统当机。虽然包括 AMD 与 Intel 在内的所有厂商都会时而发现错虫 (正式称为勘误 errata),但大多数都可以 BIOS 微码更新来修正。这方案也同样适用于 Phenom,不过 AMD 预计在套用权宜修正后会有 10% 的效能滑落。在 AMD Phenom vs. Athlon 比一比或 Phenom 主机板兼容性测试时,我们并未遇到任何不正常的情况,但使用者在未来某一天刚好遇到也不是不可能的事。若为安全起见,我们强烈建议使用者等待应该会在春季推出的 B3 步进,因为其间的效能差异大到使用者不愿意接受的程度。

让我们观察 Phenom 在较高时脉速度下的表现。















测试设定









效能测试结果


效能测试结果包括每个效能测试两张图表。第一个图表秀出完成效能测试的实际分数或所需时间,我们藉以显示四核心的 Phenom 在相同时脉速度之下,的确明显比 Athlon 64 X2 还快。此外,我们统一以 2.2 GHz 结果为 100% 基准,并观察每增加 200 MHz 时的效能变化。



游戏效能测试















游戏软件,续















音讯软件效能测试













视讯软件效能测试













视讯软件,续












应用软件效能测试















应用软件,续













应用软件,续
















综合软件效能测试














综合软件,续













综合软件,续














综合软件,续














Vista 体验指数














结论






我们比较了从 2.2 GHz 到 2.8 GHz 之间不同时脉速度的 Athlon 64 X2 与 Phenom 9000,以观察 Phenom 在增加时脉速度时是否能达到较高的每时脉效能水准。我们将测试局限在单处理核心,因为 Phenom 9000 在几乎所有效能测试项目中,双核或四核测试都会出现超出许多的效能。使用者可在效能测试段落中看到,Phenom 在几乎所有效能测试中都带来较佳的效能。我们认为第二个图表更为有趣,这张表显示了以 2.2 GHz 为基准后的每核心效能增益。

每核心效能的延展性不若 Athlon 64 X2 在 2.2 到 2.8 GHz 之间的变化。这代表 Phenom 较高时脉速度下的效能增益,不若以往 Athlon 64 X2 的幅度。让我提供一些数据,以强化读者的感受:Athlon 64 X2 在效能测试的 18 项中胜出,而 Phenom 9000 只在四个领域带来较高的延展性。我也要强调的是我们采用 Asus 的 BIOS 版本 0603,此版本并未内含 Phenom TLB 错虫的修正。因此 Phenom 是在无任何效能限制的情况下运作的。

不过要记住的是,我对于 Phenom 延展性较差的陈述只限于单核心的情况;整体观察四核 (Phenom 9000) 或三核 (Phenom 7000,预计 2008 年第一季推出) 时,Phenom的确能超越 Athlon 64 X2 的表现。而且也没有人会只用到 Phenom 的单一核心,而单核心的效能测试也无法受益于当多核心存取与修改相同数据时共享 L3 快取所带来的效能提升。

过去也出现过类似案例:新处理器无法带来优于先前世代的效能。Intel 的第一款 90 nm 处理器 Pentium 4 Prescott 即使加上技术上的改良,也无法在效能上超越 130 nm Northwood。但当时的 Prescott 仍是未来方向所系,因为它可以让 Intel 部署更大容量的快取,并向前移往双核设计。看着 AMD 在 2007 年所遭遇的困难,我们确信 Phenom 仍有许多值得期待的空间。
本帖最近评分记录
  • 心来了 金币 +27 转贴分享造福大众,论坛所有会员向您致敬! 2008-6-18 07:24

点此感谢支持作者!本贴共获得感谢 X 2
TOP



当前时区 GMT+8, 现在时间是 2025-7-3 16:07