sissel 2012-7-27 12:35
超线程没落 3570K/3770K性能终极对决[34P]
内容导航:
[b]Intel HT技术发展历程[/b]
2002年Intel面向Xeon服务器处理器发布了全新的超线程技术(Super-Threading),在单个物理核心上可以实现两个逻辑处理线程,以提升CPU的综合性能,很快Intel就将这一技术推广到桌面Pentium 4处理器上,首款Pentium 4 3.06GHz HT版在同年11月14日正式发布。
[img]http://hardware.mydrivers.com/img/20120727/11163062.jpg[/img]
按照Intel的官方说明带有HT技术的Pentium 4处理器仅比标准处理器多耗费5%左右的晶体管数量,就可以实现15-30%的性能提升,基于此Intel随后对Pentium 4产品线大规模推广超线程技术,同时Intel也正式将桌面版超线程技术定义为Hyper-Threading(HT)。
一直到2006年Q1季度,Intel最强双核四线程Pentium Processor Extreme Edition 955和Pentium Processor Extreme Edition 965的发布,带领超线程技术到了一个新的高度,不过由于Pentium Processor Extreme Edition处理器过长的流水线级数,导致处理器功耗非常之高,TDP达到了130W,相比AMD推出的Althon X2处理器,高频低能表现尤为突出。
随后的2006年中旬Intel发布了划时代意义的Core 2 Duo处理器,在简化流水线级数后,Core 2 Duo能效比得到全面提升,不过Intel也暂时将沿用已久的超线程技术雪藏,直到2008年Intel在Nehalem和Atom处理器上终于拾起了沉寂达两年之久的超线程技术。
[img]http://hardware.mydrivers.com/img/20120727/11163070.jpg[/img]
从2008年到现在Intel一直将HT技术作为一项必不可少的技术大力推广,Nehalem、Lynnfield、Sandy Bridge、Ivy Bridge等将HT技术发扬广大,而为了差异化市场Intel还根据是否配备HT技术来细分CPU定位。现在熟知的Core i7、Core i5、Core i3、Pentium、Celeron等主要就是根据核心/线程数量来划分的。
[b]超线程技术工作原理实现[/b]
HT技术发布之初的目的是解决单核处理器任务繁重问题,首款Intel Pentium 4 3.06GHz处理器提供两个运行模式,Single Task Mode(单任务模式)及Multi Task Mode(多任务模式),当程序不支持多线程(Multi-Processing)时,系统会停止其中一个逻辑CPU的运行,把资源集中于单个逻辑CPU中,让单线程程序不会因其中一个逻辑CPU闲置而降低性能,但由于被停止运行的逻辑CPU还是会等待工作,需要占用一定的资源,因此HT CPU运行在单线程程序模式时,有可能达不到不带超线程功能的CPU性能,而多核超线程CPU也会出现类似的情况。
[img]http://hardware.mydrivers.com/img/20120727/11163071.gif[/img]
我们知道x86处理器长期以来一直采用了超标量运算设计,也就是说在同一时间CPU内核在进行多种不同的操作,也正是因为超标量设计,使得x86处理器可以单核实现双线程。而同样基于超标量运算设计的IBM POWER7处理器单个核心则可以达到4线程。
[img]http://hardware.mydrivers.com/img/20120727/11163077.jpg[/img]
超标量设计的处理器的流水线主要包括取指令(IF)、指令译码(ID)、执行(EX)、存储器访问(MEM)和写回(WB)五个子过程,每一个子过程都需要耗费一个或多个时钟周期,理论上每个子过程都是独立进行的。
[img]http://hardware.mydrivers.com/img/20120727/11163081.gif[/img]
不过由于在取指令、分析指令和执行指令三个部件都存在Cache的访问,为了解决他们的冲突,很多处理器都加入了先行控制技术,通过对指令流和数据流的预处理和缓冲, 能够尽量使指令分析器和指令执行部件独立地工作,并始终处于忙碌状态, 以提高处理器中部件的利用率。
[img]http://hardware.mydrivers.com/img/20120727/11163084.gif[/img]
虽然先行控制技术可以解决很大一部分冲突,不过由于缓冲区域的有限,一部分冲突还是无法避免,甚至会直接导致出错重新执行的情况,这在很大一定程度上会影响超线程的理论执行效率。
[b]多核时代来临 超线程开始没落?[/b]
从最早的Pentium 4单核双线程到现在的Xeon E7-8800系列十核二十线程,Intel CPU的线程数翻了十倍,理论计算速度更是提升了几十倍,即使在桌面市场目前也达到了六核十二线程。
[img]http://hardware.mydrivers.com/img/20120727/11163085.jpg[/img]
由于早期线程匮乏而引入的超线程技术在多核时代是否有必要呢?另外多线程对单核性能发挥又有多大影响呢?
[img]http://hardware.mydrivers.com/img/20120727/11163087.jpg[/img]
我们知道目前的应用程序,包括很多游戏大部分已经能够支持多核处理器,早期单纯以CPU频率界定游戏性能的时代已经过去,既然游戏等应用程序已经能够支持多核,那么扩展到多线程是否也能获得良好的支持呢?
[img]http://hardware.mydrivers.com/img/20120727/11163088.jpg[/img]
本文将结合Intel最新的Ivy Bridge处理器,通过一系列的多线程应用测试来分析Intel超线程技术的应用状况。而对于高端CPU,游戏应用占据了很大一部分,而长期以来游戏用Core i5的理论也逐渐成为游戏玩的座右铭,本文将全面解读Core i5/Core i7的性能表现,帮助用户选择合适的处理器。
[b]测试平台和测试方法介绍[/b]
由于目前Intel Ivy Bridge平台并没有双核四线程的Core i3,所以测试仅选取了四核八线程的Core i7 3770K和四核四线程的Core i5 3570K。
[b]测试平台[/b]
[img]http://hardware.mydrivers.com/img/20120727/475e37913e924a46aa7eea196f0c252d.jpg[/img]
为尽量发挥CPU的性能,显卡选择了目前单卡性能最强的GTX 680,还特别用了微星最新的GTX 680 Lightning显卡,产品默认核心频率为1111MHz,Boost频率更是高达1167MHz,配备2GB GDDR5显存,显存频率为6008MHz。
由于测试的平台是反映超线程对处理器性能的影响,所以测试成绩除了两款产品默认环境下的性能对比,还添加了4GHz下同频率的对比,另外我们还添加了一组Core i7 3770K 4GHz关闭超线程后的成绩作为对比。
由于Core i5/i7 CPU对游戏帧率影响并不大,为更加准确反映其真实性能,所有测试尽量选择波动较小的Benchmark纪录,部分没有Benchmark的游戏测试则采用Fraps纪录平均帧数。而CPU纯计算性能测试则全部基于Benchmark。
[b]四核VS八线程 3570K/3770K规格详解[/b]
Core i5 3570K和Core i7 3770K都基于Intel最新的22nm 3D Tri-gate晶体管技术,其中Core i5 3570K采用了四核四线程设计,默认频率为3.4GHz,Turbo频率可到3.8GHz,拥有6MB的三级缓存,整合的双通道DDR3内存控制器,支持双通道DDR3 1600内存。
[img]http://hardware.mydrivers.com/img/20120727/11163092.gif[/img]
Core i7 3770K则基于四核八线程设计,默认频率为3.5GHz,Turbo频率可到3.9GHz,配备完整的8MB三级缓存,整合双通道DDR3内存控制器,同样支持双通道DDR3 1600内存。
而图形核心方面,Core i7 3770K和Core i5 3570K都基于Graphics HD 4000 GPU,拥有16个EU单元,默认频率为650MHz,Turbo可到1150MHz,另外两款产品的TDP也都为77W。
[img]http://hardware.mydrivers.com/img/20120727/11163102.gif[/img]
最后还是把Turbo频率详细说明下,从图中可以看到Core i5 3570K的单核、双核、三核、四核频率分别为3.8GHz、3.8GHz、3.7GHz、3.6GHz,而Core i7 3770K分别为3.7GHz、3.8GHz、3.9GHz、3.9GHz,比Core i5 3570K全面高出了0.1GHz。
[b]计算性能测试:CineBenchmark 11.5[/b]
[b]默认频率[/b]
CineBenchmark 11.5是一款支持多线程CPU渲染的工具,首先进行的是一组Core i7 3770K/Core i5 3570K的默认频率对比,测试分为单线程、双线程、四线程和八线程4组,其中3570K由于只有四个线程,无法参与八线程的测试。
[img]http://hardware.mydrivers.com/img/20120727/11163106.gif[/img]
CineBenchmark 11.5测试中,虽然Turbo频率频率、缓存规格全面胜出,但是Core i5 3570K和Core i7 3770K的对比却出现了不同寻常的成绩,在单线程和双线程测试中,Core i5 3570K输给了Core i7 3770K,不过四线程测试时却出现了逆势超越的情况。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
接下来的一组CineBenchmark 11.5测试,Core i5 3570K、Core i7 3770K都超频至4.0GHz,关闭CPU节能技术,另外还附加了一组Core i7 3770K关闭超线程的成绩(后续的测试都采用这一设定,不再加说明)。
[img]http://hardware.mydrivers.com/img/20120727/11163109.gif[/img]
从测试成绩来看,Core i7 3770K 4T(关闭超线程)在单线程、双线程、四线程测试中全面取胜,同时我们也注意到在四线程测试中,Core i7 3770K 8T(开启超线程)意外的输给了规格还要低的Core i5 3570K。
[b]计算性能测试:wPrime 32M[/b]
[b]默认频率[/b]
wPrime同样是一款多线程CPU测试工具,本文中全部选择了32M模式,测试成绩同样包括单线程、双线程、四线程和八线程4组。
[img]http://hardware.mydrivers.com/img/20120727/11163110.gif[/img]
默认频率下,Core i5 3570K自始至终都和Core i7 3770K保持了一定的差距,不过我们看到在线程数增多的情况下,它们的差距逐渐缩小,四线程时Core i5 3570K仅慢了0.06s。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
[img]http://hardware.mydrivers.com/img/20120727/11163113.gif[/img]
超频至4GHz后,Core i7 3770K 8T依然领先Core i5 3570K,不过我们注意到差距得到进一步缩小,四线程时仅慢了0.02s,另外Core i7 3770K 4T再次坐上第一把交椅,在四线程测试中仅耗时9.53s。
[b]计算性能测试:Fritz Chess Benchmark[/b]
[b]默认频率[/b]
Fritz Chess Benchmark是一款国际象棋测试软件,但它并不是独立存在的,而是《Fritz9》这款获得国际认可的国际象棋程序中的一个测试性能部分。它可以让我们的x86计算机也能完成IBM“深蓝”当初所做的事情,那就是计算国际象棋的步法预测和计算,虽然现在我们的个人电脑依然无法与10年前IBM的“深蓝”相提并论,并且无论是在处理器架构方面、节点方面还是AIX操作系统方面都有很大的差距,但是Fritz Chess Benchmark依然是目前在个人计算机方面最好的步法计算和预测软件。
[img]http://hardware.mydrivers.com/img/20120727/11163115.gif[/img]
Fritz Chess Benchmark测试中,Core i5 3570K在单线程和双线程中落败,不过随后的四线程测试再次逆转以10725Knps的成绩大幅领先Core i7 3770K。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
[img]http://hardware.mydrivers.com/img/20120727/11163117.gif[/img]
超频至4GHz对等频率后,Core i5 3570K和Core i7 3770K 4T表现惊人的相似,而在四线程测试中,全面领先Core i7 3770K 8T,而从其和Core i7 3770K 4T的对比发现,Fritz Chess Benchmark测试对缓存依赖并不太大。
[b]计算性能测试:Super PI 32M[/b]
[b]默认频率[/b]
Super PI是一款单线程CPU测试工具,利用CPU的浮点运算能力来计算出π(圆周率),目前普遍被超频玩家用做测试系统稳定性和测试CPU计算完后特定位数圆周率所需的时间。
[img]http://hardware.mydrivers.com/img/20120727/11163120.gif[/img]
默认频率下Core i5 3570K和Core i7 3770K运行Super PI测试时激活单核满足,实际频率分别为3.8GHz和3.9GHz,两者耗时分别为9.735s和9.406s。
超频至4GHz,添加一组关闭超线程Core i7 3770K成绩
[img]http://hardware.mydrivers.com/img/20120727/11163121.gif[/img]
由于是同频测试,所以测试成绩与缓存配置有关,Core i5 3570K耗时为9.204s,而Core i7 3770K 4T和Core i7 3770K 8T均为9.11s。对比三者的缓存分别为6MB、8MB、8MB,从侧面也可以反映出Super PI对CPU缓存依赖较大。
[b]综合性能测试:3DMark Vantage[/b]
[b]默认频率[/b]
3DMark Vantage是一款基于DirectX 10的PC综合测试软件,是业界第一套专门基于微软DX10 API接口、Windows Vista操作系统打造的综合性基准测试工具,能全面发挥多路显卡、多核心处理器的优势。3DMark Vantage提供了全新打造的两个图形测试项目、两个处理器测试项目、六个特性测试项目,并引入四种不同等级的参数预设(Preset),可以更细致地反映系统性能等级。
[img]http://hardware.mydrivers.com/img/20120727/11163123.gif[/img]
测试选取了极限Extreme测试模式,由于3DMark Vantage软件显卡权重较大,在显卡相同的情况下,总分差别并不十分明显,为此我们还加入了CPU子项分数的对比。
CPU子项得分Core i7 3770K全面领先Core i5 3570K,领先幅度达到了28%,除了频率的优势,主要得益于Core i7 3770K强大的八线程。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
[img]http://hardware.mydrivers.com/img/20120727/11163126.gif[/img]
在剔除掉频率优势后,Core i7 3770K 8T得分依然大幅领先Core i5 3570K,倒是Core i7 3770K 4T和Core i5 3570K非常接近,其间微小的差异主要来自6MB/8MB缓存的影响。
[b]综合性能测试:3DMark 11[/b]
[b]默认频率[/b]
3DMark 11使用原生DirectX 11引擎,基于Bullet物理引擎,在测试场景中应用了包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DX11新特性。产品包含了Deep Sea和High Temple两大测试场景和四个图形测试项目,画面效果堪比CG电影。
[img]http://hardware.mydrivers.com/img/20120727/11163129.gif[/img]
3DMark 11测试同样基于Extreme模式,CPU测试成绩基本和3DMark Vantage相似,程序能够充分调用处理器超线程,以提升物理处理速度。由于线程和频率差异,Core i5 3570K和Core i7 3770K CPU子项得分差距达到了32%。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
[img]http://hardware.mydrivers.com/img/20120727/11163126.gif[/img]
4GHz同频下,Core i7 3770K 8T再次大幅领先,而Core i5 3570K再次和Core i7 3770K 4T保持在同一水准,1.3%的差异主要是6MB/8MB缓存造成。
[b]游戏性能测试:《战地3》[/b]
[b]默认频率[/b]
《战地3》是一款由EA DICE工作室(EA Digital Illusions CE)开发制作、EA出版发行的第一人称射击游戏。游戏使用寒霜2引擎,该引擎也是“战地”系列首款全面支持DirectX11技术的引擎。
[img]http://hardware.mydrivers.com/img/20120727/11163135.gif[/img]
默认频率下我们极不情愿的看到Core i5 3570K以83.1fps的微弱优势领先Core i7 3770K,而从前面的纯计算来看,《战地3》所使用的寒霜2引擎是不支持超线程技术的。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
[img]http://hardware.mydrivers.com/img/20120727/11163137.gif[/img]
接下来的4GHz同频测试中,Core i7 3770K 4T以85.5fps的成绩全面领先Core i7 3770K 4T和Core i5 3570K,同时我们也注意到Core i5 3570K几乎和Core i7 3770K 4T性能一致。
[b]游戏性能测试:《现代战争3》[/b]
[b]默认频率[/b]
《使命召唤:现代战争3》(Call of Duty : Modern Warfare 3)是美国动视暴雪旗下“现代战争”系列的第三部作品。游戏由Sledgehammer Games、Infinity Ward、Raven Software联手制作。作为《现代战争2》的续篇,本作将会揭晓“现代战争”系列主角的去向与秘密。全新角色、新科技冷武器、更加浩大的战争场面,《使命召唤:现代战争3》将会带领玩家体验到更加真实的现代战争。
[img]http://hardware.mydrivers.com/img/20120727/11163138.gif[/img]
《现代战争3》测试中,Core i5 3570K再次领先Core i7 3770K,领先幅度为4.4%。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
[img]http://hardware.mydrivers.com/img/20120727/11163142.gif[/img]
超频至4GHz后,Core i7 3770K 4T再次以绝对优势领先,平均帧率为158.2fps,令人意外的是紧随其后的是Core i7 3770K 8T,我们猜测着应该是测试误差所致。
[b]游戏性能测试:《地铁2033》[/b]
[b]默认频率[/b]
《地铁2033》描述了西元2033年,由于核战爆发,整个世界都笼罩在辐射之下,人类几乎死尽。仅存的人类躲藏在莫斯科的地铁站里挣扎求生,布满辐射尘的地表已为各种变种生物所占据,地底的列车站台成了人们最后的聚集地。人类的生存空间在那些日益增多的变种生物的威胁下一天天缩小,人类几乎绝迹。故事的主角阿尔乔姆是核爆后出生的生存者,他的兴趣是收集战前的风景明信片,梦想地表的模样;某日,一起突如其来的事件迫使阿尔乔姆踏上旅途,前往其他的站台求援,以拯救自己居住的地铁站以及最后人类的命运……一个掌握着人类命运的青年即将踏上未知的冒险之旅,寻找拥有拯救人类的力量的英雄。
[img]http://hardware.mydrivers.com/img/20120727/11163145.gif[/img]
《地铁2033》不愧为最变态的游戏,在Core i7 3770K+超频版GTX 680显卡的环境下竟然只能刚刚流畅运行,而测试成绩再次毫无悬念的出现了Core i5 3570K领先Core i7 3770K的情景。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
[img]http://hardware.mydrivers.com/img/20120727/11163146.gif[/img]
设置为4GHz同频后,Core i7 3770K 4T再次以30.5fps的成绩领先Core i5 3570K和Core i5 3770K 8T,值得注意的是后两者都为30fps。
[b]待机和满载功耗测试[/b]
[b]默认频率[/b]
虽然性能一直作为衡量CPU的重要指标,不过对于高性能CPU,功耗也不容忽视,好在采用最新的22nm功耗后,Core i7 3770K和Core i5 3570K保持为相同的77W TDP。测试中选择的CPU满载工具为LinX。
[img]http://hardware.mydrivers.com/img/20120727/11163148.gif[/img]
虽然两款产品TDP同为77W,不过规格削减的Core i5 3570K无论是在待机还是满载都要低出一些,待机只有5.84W,满载为54.31W,而Core i7 3770K则分别为9.85W和64.76W。
[b]超频至4GHz,添加一组关闭超线程Core i7 3770K成绩[/b]
[img]http://hardware.mydrivers.com/img/20120727/11163149.gif[/img]
超频至4GHz后,由于手动在BIOS中关闭了CPU节能选项,待机功耗出现了显著的上升,Core i5 3570K、Core i7 3770K 4T和Core i7 3770K 8T分别为28.67W、32.2W和33.05W。其中Core i7 3770K 4T更和Core i7 3770K 8T接近一些。而在满载情况下,Core i5 3570K、Core i7 3770K 4T和Core i7 3770K 8T分别为68.77W、69.86W和76.42W。
[b]总结:真核才是真的好[/b]
整个测试下来,Core i7 3770K、Core i5 3570K的性能对比给我们留下了深刻的印象,Core i7 3770K强大的规格(四核八线程和完整8MB三级缓存)似乎并没有得到充分的发挥。
目前来看应用程序,特别是游戏已经能够全面的支持多核处理器,这也直接导致Core i5 3570K和Core i7 3770K能够获得非常不错的游戏表现,但是遗憾的是游戏以及绝大多数的应用程序并不能够很好的支持超线程,而超线程CPU闲置的逻辑核心还是会等待工作,需要占用一定的资源,这也直接导致物理核心的性能发挥受到制约,导致超线程CPU在四线程测试中全面落败。
[img]http://hardware.mydrivers.com/img/20120727/11163151.gif[/img]
虽然我们一直在倡导使用实际应用来反映产品的正式性能,不过受到操作复杂度、误差较大等因素的影响,目前的测试主要还是基于“稳扎稳打”的Benchmark。而从这些测试的Benchmark来看,Intel超线程都能够得到很好的支持,而实际游戏、应用却并非如此,很少的游戏会支持超线程。
由于时间限制我们并没有执行足够多的应用测试来反映Core i7 3770K、Core i5 3570K具体性能表现,通过以上的测试,我们简单的归纳出以下几点:
[b]超线程:[/b]对于不支持超线程的应用程序或游戏来说,超线程会制约CPU物理核心性能的发挥,特别是在所有物理核心均负载时,制约将更加明显。而目前的实际情况是游戏支持超线程的并不多,毕竟选择高端Core i7/i5处理器用户有很大一部分是为了获得更好的游戏体验。目前来说Ivy Bridge平台Core i5和Core i7的差价约为700元,视具体的型号有所不同,这是一款Core i5处理器2/3的价格,不容忽视。
[b]缓存:[/b]Core i5 3570K和Core i7 3770K的6MB、8MB缓存差异我们已经见识了,测试性能差异基本都在5%以内,看似微不足道,不过从仅仅只是2MB缓存来看,还是非常可观的,如果从这一点来看,Core i7还是不错的。
应用程序:目前应用程序厂商似乎并不注重超线程的开发,这也直接导致游戏等很多应用,超线程CPU的性能同比出现下滑,倒是目前的绝大部分测试Benchmark都支持Intel超线程技术,我们目前尚不清楚超线程应用程序的开发是受什么原因影响,导致应用受阻,毕竟超线程确实可以为CPU带来整体约25%的性能提升。
[b]功耗:[/b]正如Intel所言,超线程CPU需要多耗费约5%的晶体管,这也会直接提升CPU的功耗,测试中已经全面反映出来,以Core i7 3770K为例关闭和开启超线程前后,满载功耗差距约为9.4%。
[b]用户:[/b]相信看了整篇的测试,用户已经知道到底需要购买Core i5还是Core i7了,处于CPU性能相对过剩的时代,四核四线程的Core i5已经能够很好的满足各种需求,而且其性价比也相对Core i7高出不少,更重要的是游戏性能表现也相当出色,非常值得购买。
反观Core i7性价比较低,这也是高端处理器的一个共同点,在实际应用程序、游戏中表现并不十分出色,甚至比同频的Core i5还要弱一些,这主要受到Core i7超线程的影响,当然如果用户为了追求更高的游戏表现,也可以选择关闭超线程获得更高的游戏帧率,另外Core i7完整的8MB三级缓存也使得其与同频Core i5相比有一定的性能优势。
cuocuolong 2012-7-27 13:06
非常的强大,学习了!!!!!!!!!!!!
ren52jing 2012-7-27 21:59
现在才是超线程大显身手的时候。超线程依赖处理器强大的计算能力,在早期,处理器计算能力差,虽然有超线程技术,但是处理机核心的处理能力并不能应付超线程技术要求的数据计算,只有超标量在早起的处理器中得到了真正的应用。而现在处理器的强大计算能力,完全能应付如此大量的数据计算,因此超线程才得到了真正的应用,这也是为什么一个物理核心能模拟出两个逻辑核心,完全是处理器强大计算能力和超线程技术配合的产物。超线程的没落,欺负大家不懂技术吗?
kwkkwkkwk 2012-8-5 18:49
越是高效的架构,空余的运算单元越少,HT能得到的资源复用效果越差..........