AMD的反击四核心Barcelona架构分析_CPU故障

AMD的反击四核心Barcelona架构分析
[08-24 16:01:14] 来源：http://www.85jc.com CPU故障 阅读：8475次

概要：SSE128：在从K8到Barcelona的众多改进中有一个非常重要的改变，AMD把它称为SSE128。在K8架构中可以同时执行两（电脑没声音）个SSE指令，但是SSE的执行带宽仅仅只有64-bit。在K8中执行一个128-bit的SSE指令，必须要分成两（电脑没声音）个64-bit指令来执行。这意味着执行一个128-bit的SSE指令需要占用一个额外的解码通道。Barcelona把K8的64-bit SSE的执行带宽提高到了128-bit，因此执行一个128-bit的SSE指令不用再进行分解。这样一来不但可以获得更多可用的解码带宽，而且指令的执行效率也大大提高。增加SSE指令的执行带宽也会造成核心内部的很多改变。由于获得了更多的解码带宽，在执行128-bit的SSE指令时有出现了一个新的瓶颈，那就是指令取得带宽。Barcelona的指令取得带宽已经从K8的每周期16byte提高到了32byte。32byte的指令取得带宽不仅仅有益于SSE编码，对整数编码也同样非常有好处。更大的指令取得带宽会明显推进处理器性能。在Barcel

AMD的反击四核心Barcelona架构分析,标签：CPU维修,cpu故障现象,http://www.85jc.com

　　SSE128：

　　在从K8到Barcelona的众多改进中有一个非常重要的改变，AMD把它称为SSE128。在K8架构中可以同时执行两（电脑没声音）个SSE指令，但是SSE的执行带宽仅仅只有64-bit。在K8中执行一个128-bit的SSE指令，必须要分成两（电脑没声音）个64-bit指令来执行。这意味着执行一个128-bit的SSE指令需要占用一个额外的解码通道。Barcelona把K8的64-bit SSE的执行带宽提高到了128-bit，因此执行一个128-bit的SSE指令不用再进行分解。这样一来不但可以获得更多可用的解码带宽，而且指令的执行效率也大大提高。增加SSE指令的执行带宽也会造成核心内部的很多改变。由于获得了更多的解码带宽，在执行128-bit的SSE指令时有出现了一个新的瓶颈，那就是指令取得带宽。Barcelona的指令取得带宽已经从K8的每周期16byte提高到了32byte。32byte的指令取得带宽不仅仅有益于SSE编码，对整数编码也同样非常有好处。更大的指令取得带宽会明显推进处理器性能。

点击浏览下一页

　　在Barcelona上你可以取得和解码更多的指令，这意味着你需要获得更多的数据到执行核心，因此AMD加宽了L1缓存和SSE寄存器之间的传输界面。现在Barcelona可以每周期执行两（电脑没声音）个来自L1-D缓存的128-bit SSE指令，原理和K8每周期执行两（电脑没声音）个64-bit指令一样。加上AMD同时加宽了L2缓存可内存控制器之间的传输界面，从而解决了指令取得带宽的瓶颈。事实上SSE128的改进非常类似于Yonah到Merom的改进。在Conroe/Merom之前Yonah的FP/SSE性能还不如K8。这在Yonah和K8的性能对比测试中有很明显的表现，虽然两（电脑没声音）者在大多数应用程序、3D渲染和游戏性能中的性能表现非常接近，但是在视频编码性能测试中K8明显要优于对手。但是Core 2处理器的出现使这种情况发生了逆转，视频编码性能大幅度超越K8。也许SSE128的改进会使这种情况有所改变。

　　更高级的分支预测器：

　　尽管SSE128被AMD称为Barcelona的最大改进，但是这只是冰山一角而已。在技术改进清单中排在最前面的是分支预测器。分支预测器的工作原理很简单，如果分支编码结果之前曾经被取用过，那么它将最有可能在下一次被提取。所以分支预测器的用途在于监测正在被CPU执行的指令，并且相应的对指令被执行的次数进行记录，来统计特定地址的分支编码结果被提取的概率。一旦计数器内部累积足够的数据，分支预测器就可以相对比较精确的对分支结果是否会被提取进行预测。通常来讲，CPU的分支预测器性能会直接影响数据处理的精确度。K8的分支预测器就非常好，对它的架构做了专门的优化。不过Intel的Pentium M和Pentium 4采用的分支预测器技术要更为出色。在Barcelona中将增加了一个512通路的间接分支预测器，更多的分支预测器将使Barcelona比K8获得和预测更多的历史数据，而更多的历史数据也会使支预测器更加精确。

　　频带堆栈优化和更快的加载速度：

　　Intel在Pentium M上首次提出了一个叫做专用堆栈管理器的功能，顾名思义就是用一个堆栈管理器来操作所有的X86堆栈运转。简单来说就是通过独立的堆栈管理器减轻了处理的负担。在Barcelona上AMD采用了相类似的技术，称为Sideband Stack Optimizer(频带堆栈优化)，不但可以单独处理所有的堆栈运转，而且对堆栈处理器进行了优化，使其不浪费执行单元的位宽。

　　Barcelona还将具有Out-of-order load execution(乱序载入处理)能力，某些指令在实际运行当中可以绕过其他指令的处理，而且指令的存储也可以不按顺序进行，这在某些环境下对效率的提高有着很关键的作用。

　　更快速的内存控制器：

　　从以往的经验来看，AMD每推出一款新的处理器都会对内存控制器进行一次增强http://www.85jc.com，Barcelona也不例外，它的内存控制器改进将会使内存性能得到很大的提升。和K8相比Barcelona的内存控制器将更加智能化。K8(Socket-940/939/AM2)处理器整合的是一个128-bit内存控制器，而在Barcelona中这个内存控制器被分离成两（电脑没声音）个64-bit控制器。每个控制器都可以独立运行，从而使内存控制的效率更高。尤其是四个核心分别处理不同的任务时它的优点更加明显。另外，Barcelona的北桥也将拥有比K8更高的带宽，考虑到高带宽的利用这个北桥将支持未来的DDR3内存标准。不过照目前的消息来看，起初发布的Barcelona仍然只支持DDR2内存。

上一页 [1] [2] [3] 下一页

Tag:CPU故障，CPU维修,cpu故障现象，电脑学习 - 电脑故障维修 - CPU故障

上一篇：拒绝谎言，测试CPU的稳定性

《AMD的反击四核心Barcelona架构分析》相关文章

留言板: 您有任何疑问请在此留言,我们会第一时间帮您解答; 取消发布留言