54775558 2016-8-25 22:53
AMD Zen架构细节全公开!40%飙升这么来[15P]
AMD日前专门召开技术会议,[url=http://news.mydrivers.com/1/495/495989.htm]首次披露了Zen CPU的架构设计[/url],并公开展示同频8核心16线程下可以战平Intel Core i7-6900K。
[url=http://img1.mydrivers.com/img/20160824/95d7a1ecf2414ec5ad40194800fea1df.png][img]http://img1.mydrivers.com/img/20160824/s_95d7a1ecf2414ec5ad40194800fea1df.png[/img][/url]
不过,当时关于架构只讲了一些大概的情况,而今在Hot Chips 2016大会上,AMD又首次公布了Zen架构的诸多细节,详细解释了40%的提升是怎么来的。
[url=http://img1.mydrivers.com/img/20160824/a1d95e68508d4fc98ae603d3b277458f.jpg][img]http://img1.mydrivers.com/img/20160824/s_a1d95e68508d4fc98ae603d3b277458f.jpg[/img][/url][url=http://img1.mydrivers.com/img/20160824/b4093f205b2c46de9283ffb195925886.jpg][img]http://img1.mydrivers.com/img/20160824/s_b4093f205b2c46de9283ffb195925886.jpg[/img][/url]
首先,[b]所谓40%提升指的并非实际性能,而是每时钟周期指令数(IPC)这一理论指标的变化,对比对象是当前的Excavator挖掘机架构。
[/b][b][url=http://img1.mydrivers.com/img/20160824/f5cd578262314cc69cc7365fbcef252a.jpg][img]http://img1.mydrivers.com/img/20160824/s_f5cd578262314cc69cc7365fbcef252a.jpg[/img][/url][/b]
这就是Zen架构在性能、能耗方面的一些具体改进,其中[b]核心引擎改进包括:每核心支持两个逻辑线程、分支误预测改进、更好的分支预测、更大的操作缓存、更宽的微指令分派、更大的整数/浮点指令调度器、更大的回退、更大的回退/载入/存储序列。[/b]缓存系统有一级缓存写回、更快的二级/三级缓存、更快的浮点单元载入、更好的一级/二级数据预取器、一级/二级缓存带宽提升接近1倍、三级缓存总带宽提升最多4倍。为了降低功耗,Zen架构也是做了大量工作,全程采用低功耗设计理念,包括多层级时钟门控、一级缓存写回、更大操作缓存、堆栈引擎等等。
[url=http://img1.mydrivers.com/img/20160824/c9ccd2eec8ac41baa542bed17e5fda69.jpg][img]http://img1.mydrivers.com/img/20160824/s_c9ccd2eec8ac41baa542bed17e5fda69.jpg[/img][/url]
核心微架构细节:[b]拾取四个x86指令、操作缓存指令、四个整数单元、两个存储/载入单元(支持72个乱序载入)、两个浮点单元(128-bit FMAC)、4-way 64KB一级指令缓存、8-way 32KB一级数据缓存、8-way 512KB二级缓存、8MB共享三级缓存。
[/b][url=http://img1.mydrivers.com/img/20160824/4624e40ac1744715b3bfc3c4a34894cc.jpg][img]http://img1.mydrivers.com/img/20160824/s_4624e40ac1744715b3bfc3c4a34894cc.jpg[/img][/url]
指令拾取部分
[url=http://img1.mydrivers.com/img/20160824/335e1f64070c4906ba92659f411bb3a9.jpg][img]http://img1.mydrivers.com/img/20160824/s_335e1f64070c4906ba92659f411bb3a9.jpg[/img][/url]
解码部分
[url=http://img1.mydrivers.com/img/20160824/8376cf6479b04143aa3b7581de73040e.jpg][img]http://img1.mydrivers.com/img/20160824/s_8376cf6479b04143aa3b7581de73040e.jpg[/img][/url]
执行部分
[url=http://img1.mydrivers.com/img/20160824/37bc7f47d4174f548ff40b4d963449ed.jpg][img]http://img1.mydrivers.com/img/20160824/s_37bc7f47d4174f548ff40b4d963449ed.jpg[/img][/url]
载入/存储单元和二级缓存
[url=http://img1.mydrivers.com/img/20160824/fde630ce4ba3457ead65ed1f55dcc632.jpg][img]http://img1.mydrivers.com/img/20160824/s_fde630ce4ba3457ead65ed1f55dcc632.jpg[/img][/url]
浮点单元
[url=http://img1.mydrivers.com/img/20160824/8e9a44f50682498e8c75b11af3d850b5.jpg][img]http://img1.mydrivers.com/img/20160824/s_8e9a44f50682498e8c75b11af3d850b5.jpg[/img][/url]
缓存一致性
[url=http://img1.mydrivers.com/img/20160824/10db9a48a080480c9893911330b7cdde.jpg][img]http://img1.mydrivers.com/img/20160824/s_10db9a48a080480c9893911330b7cdde.jpg[/img][/url][b]CPU Complex(CCX)[/b]:[url=http://news.mydrivers.com/1/496/496529.htm]
这个昨天解释过了。[/url][b]Zen架构虽然每四个核心为一组,但这四个核心除了共享三级缓存之外没有其他任何关联,是彼此完全独立的。
[/b][url=http://img1.mydrivers.com/img/20160824/3aeb9ea63db442b2a440000d27c04961.jpg][img]http://img1.mydrivers.com/img/20160824/s_3aeb9ea63db442b2a440000d27c04961.jpg[/img][/url][b]
同步多线程(SMT)[/b]:所有指令仅支持单线程模式,前端队列划分优先级,除微指令队列、回退队列、存储队列之外绝大部分模块都是完全共享的。
[url=http://img1.mydrivers.com/img/20160824/a2295d43a9ec499089954a8ea4ffb6de.jpg][img]http://img1.mydrivers.com/img/20160824/s_a2295d43a9ec499089954a8ea4ffb6de.jpg[/img][/url][b]
新增指令集[/b]:ADX(扩展多精度算法)、RDSEED(补充RDRAND随机数生成器)、SMAP(高级模式访问拦截)、SHA1/SHA256(哈希加密算法)、CLFUSHOPT、XSAVEC/XSAVES/XRSTORS、[b]CLZERO(清理缓存行)、PTE Coalecing(4K页表合并为32K页),其中最后两项是AMD Zen架构独有的。[/b]同时继续支持所有标准指令集:AVX、AVX-2、BMI1/2、AES、RDRAND、SMEP。
martinchi 2016-8-26 02:41
目前还没看到真品,不知道是按摩店自己吹的还是如何