业界新闻| 小熊商情| 硬件文库| 装机学堂| 购机推荐| 酷讨论板| 读者服务| 在线帮助

          您现在的位置>>小熊在线>>装机学堂

第一章 CPU全接触 


1-2 三国鼎立看主流

 AMD

      AMD是一家值得敬佩的公司,要不是它紧紧咬住Intel不放,我们现在就不能买到如此便宜的CPU了。Intel一直想把AMD扼杀掉。 Intel在486之后就再也没有出过以阿拉伯数字命名的CPU,而是推出了一个拉丁文的Pentium,AMD也随即推出了自己设计并且生产的K5 CPU。K5系列CPU的频率一共有六种:75MHz/90 MHz /100 MHz /120 MHz /133 MHz /166 MHz,总线的频率和Pentium差不多,都是60 MHz或者66MHz。作为一款与Pentium竞争的产品,AMD的确做得非常出色,虽然在浮点运算方面比起Intel的来说是略逊一筹,但是在整数运算方面却一点也不比Intel差,由于K5系列CPU都内置了32KB的一级缓存,比Pentium内置的16KB多出了一倍,再加上它的体系结构一直比Intel的先进一些,因此在整数运算和系统整体性能方面甚至要比同样时钟频率的Pentium要高。
      K6: K6这款CPU的设计指标是相当高的,具有MMX技术、更多的片上一级高速缓存(32K指令、32K数据)和更深的流水线,可以并行地处理更多的指令,并运行在更高的时钟频率上。在整数运算方面,AMD无疑是做得非常成功的。由于K6具有更大的L1缓存,所以随着频率的增长,它能获得比Pentium MMX更显著的性能提升。K6稍微落后的地方是在运行需要使用到MMX或FP(浮点指令)的应用程序方面,比起同样频率的Pentium MMX,甚至没有MMX的奔腾都要差许多,这样就使K6在某些3D游戏方面的表现远不如Intel的出色了。另外,AMD的MMX单元一次只能处理一条指令,而Intel的MMX单元能够处理两条指令。因此K6 在执行MMX指令和浮点指令时性能要差一些。
      AMD的K6在处理某些MMX操作的时候具有比Intel的CPU更短的处理周期,但单个操作的吞吐量是一样的,而且较短的处理周期并不能弥补K6不能同时处理两个MMX指令的不足。虽然Intel的MMX CPU可以同时处理两个MMX指令,但它的MMX单元只含有一个乘法单元和一个移位单元,所以它不能同时进行这些关键操作。而且同时只能有一个MMX指令操作内存和整数寄存器在浮点处理方面起作用,因此K6在某些操作上的处理周期仍比Intel的短,但它每两个时钟周期才能开始一个操作,而Intel的芯片可以每个周期开始一个。最终的结果是对于许多浮点操作来说,AMD的芯片的吞吐量只能达到Intel芯片的一半。
      K6系列CPU一共有五种频率,分别是:166 MHz /200 MHz /233 MHz /266 MHz /300 MHz,五种型号都采用了66 MHz外频,但是后来推出的233 MHz /266 MHz /300 MHz已经可以通过升级主板的BIOS而支持100 MHz外频,是CPU的性能得到了一个飞跃。在倍频方面,K6系列是从2.5~4.5不等,核心电压则是有2.9V,3.2V,2.2V三种,特别值得一提的是他们的一级缓存都提高到了64KB,比MMX足足多了一倍,这也是K6的整数性能为什么要比MMX好的缘故了。
   1998年中,AMD最新K6-2处理器正式推出。这是首款采用3Dnow!技术的微软视窗操作系统兼容型X86微处理器。它采用了全新的硅晶体制造技术(C4倒装),这是由IBM开发的技术,将硅晶精度提高到了0.25微米,硬是将原来K6晶体面积(Die size)的168mm2降到了现在的68mm2,同时晶体数量也增加了50万个(成为930万个),其余结构基本同K6相同,L1 CACHE仍是64KB,但它的面积也比以前的小了,仅有原来的1/2大。此外它的工作电压也从2.9V/3.2V降到了2.2V。AMD在推出K6-2 CPU时,就率先加入3Dnow!浮点/3D加速技术,64位双路浮点缓存器,21条全新的3Dnow!指令集,加入单指令多数据指令(SIMD:Single Instruction,MultiDatas)。而AMD的3Dnow!技术,也随着K6-2的推出,立刻获得游戏厂商、软件厂商和图形卡驱动程序的支持,成为一项重要的工业标准。

K6-3处理器采用0.25微米线程,由二千一百三十万个晶体管组成。K6-3处理器是三层高速缓存(TriLevel)结构设计,K6-3处理器核心内建有64K的第一级高速缓存(Level 1)及256K的第二层高速缓存(Level 2),主机板上则配置第三级高速缓存(Level 3)。K6-3处理器的第一与第二层高速缓存总共320K,全部内建在处理器芯片核心内,与处理器的时钟频率相同,此高速缓存的执行速度与处理器同速运作(Full Speed)。K6-3的三层高速缓存(TriLevel)结构设计,可再支持配备在主机板上的1024K第三级高速缓存,在Super 7结构的主机板上,第三层高速缓存的时钟频率是100MHz。相较于Pentium Ⅱ仅具有32K第一层高速缓存与512K半速的第二层高速缓存,AMD的三层高速缓存结构能加大系统的高速缓存容量,以提升系统整体效能。

      K6-3处理器支持3D Now!指令集。3D Now!指令集与英特尔的KNI(Katmai New Instruction)指令集的功能类似,都是采用增加指令的方法加快3D绘图等多媒体处理及需要运用大量浮点运算的应用程序的运算速度。
     由于成本上和成品率方面的问题,K6-3处理器在台式机市场上并不是很成功,因此它将逐渐从台式机市场消失,将逐步转进笔记本市场。AMD将推出专供笔记型计算机使用的K6-3+版本处理器,K6-3+采0.18微米线程,芯片内建第二级高速缓存,除此,笔记型K6-3+将拥有自动升降电压的双模式功能(AMD代号为Gemini),类似于英特尔下一步将推出的笔记本型处理器。使用室内交流电供电时,K6-3+处理器拥有较高的时钟频率;若使用电池供电,则K6-3+处理器将自动降速,以延长电池的寿命。

     真正让AMD扬眉吐气的是原来代号K7的Athlon处理器。Athlon具备超标量、超管线、多流水线的Risc核心(3Way SuperScalar Risc core),采用0.25μ微米工艺,集成2,200万个晶体管,管芯面积为184mm,目前已经推出了更先进的0.18μ微米工的Athlon。下一步就是采用铜配线技术,AMD在制造工艺上向来就不落后于Intel。(图片athlon.jpg) 
Athlon包含了三个解码器,三个整数执行单元(IEU),三个地址生成单元(AGU),三个多媒体单元(就是浮点运算单元),Athlon可以在同一个时钟周期同时执行三条浮点指令,每个浮点单元都是一个完全的管道。K7包含3个解码器,由解码器将解码后的macroOPS指令(K7把X86指令解码成macroOPS指令,把长短不一的X86指令转换成长短一致的macroOPS指令,可以充分发挥RISC核心的威力)送给指令控制单元,指令控制单元能同时控制(保存)72条指令。再把指令送给整数单元或多媒体单元。整数单元可以同时调度18条指令。每个整数单元都是一个独立的管道,调度单元可以对指令进行分支预测,可以乱序执行。K7的多媒体单元(也叫浮点单元)有可以重命名的堆栈寄存器,浮点调度单元同时可以调度36条指令,浮点寄存器可以保存88条指令。在三个浮点单元中,有一个加法器,一个乘法器,这两个单元可以执行MMX指令和3DNow指令。还有一个浮点单元负责数据的装载和保存。由于K7强大的浮点单元,使AMD处理器在浮点上首次超过了Intel的处理器。
     Athlon内建128KB全速高速缓存(L1 Cache),芯片外部则是1/2时频率、512KB容量的二级高速缓存(L2 Cache),最多可支持到8MB的L2 Cache,大的缓存可进一步提高服务器系统所需要的庞大数据吞吐量。
     Athlon的封装和外观跟Pentium Ⅱ的SECC卡匣相似,但Athlon采用的是Slot A接口规格。Slot A接口源于Alpha EV6Bus,时钟频率高达200MHz,使峰值带宽达到1.6GB/S,在内存总线上仍然兼容传统的100MHz总线,现在的PC-100 SDRAM还是可以用的,这样就保护了用户的投资,也降低了成本。今后还可以采用性能更高的DDRSDRAM,这和Intel力推的800MHz RAMBUS的数据吞吐量差不多。EV6总线最高可以支持到400MHz,可以完善的支持多处理器。所有具有天生的优势,要知道Slot1只支持双处理器而SlotA可支持4处理器。SlotA外观看起来跟传统     242pin的Slot1插槽很像,就像Slot1插槽倒转180度一样,但两者在电气规格、总线协议是完全不兼容的。Slot 1/Socket370的CPU,是无法安装到Slot A插槽的Athlon主板上,反之亦然。
     AMD为了进一步扩大3Dnow!软件平台的支持范围,同时拉近原先3Dnow!与SSE之间的差距,在Athlon处理器中提供了Enhanced 3Dnow!技术,新添加了24条指令。其中19条控制指令,刚好跟Intel在PentiumⅢ的SSE指令中,针对现有的64位MMX缓存器所添加的视频运算、内存快速预先读取指令是完全兼容的,因此针对PentiumⅢ的SSE指令集开发的软件,只需少许修改就能顺利转移到Athlon上,发挥强悍的MMX缓存器的SIMD加速性能。另一方面,Athlon增加5条新指令,可以使CPU像DSP芯片一样直接处理模拟/数字信号的转换工作。它可以运用在软调制解调器(Soft Modem)、ADSL网络转换传输及Dolby AC-3的解码上,而Intel的CPU到目前为止,还未提供类似功能的指令。显然在新一代处理器指令集的开发中,AMD又再度发挥了创新精神。
    讲了这么多,Athlon处理器实际效能如何呢?以同样是600MHz的Athlon与600MHz PentiumⅢ相比较(Xeon目前只到550MHz而已),Athlon的整数性能(CPUMark99、WinStone99),比同频的PentiumⅢ快了10%左右;而浮点性能更是Athlon扬眉吐气之处,WinBench99的FPUmark测试值虽然仅仅快了8%左右,但是以跨平台工业评估标准的SPECfp_base95的测试结果,则快了约38%;在3D性能方面, 3D WinBench的3D Winmark以及3DMark 99 Max等软件的测试下,均领先36~38%。在运行3D Studio Max R3.0时, Athlon平台在着色处理(Rendering)的速度,大约比PentiumⅢ快了33%。由于PentiumⅢ与PentiumⅢ Xeon的差别在于L2缓存的容量与速度(Xeon为全速L2缓存),如果拿只有512KB L2缓存的入门级Xeon处理器来比较,跑大多数软件时,Xeon只有整数性能比PentiumⅢ快一点,浮点性能两者完全相同。因此在Athlon vs PentiumⅢ&Xeon的实测结果,1/2频率的L2 Cache设计的Athlon,在任何软件的表现上都击败全速L2 Cache设计的Xeon处理器。
      最近AMD又推出了800MHz的Athlon;Athlon 800MHz处理器仍是SlotA结构,不过新款式的Athlon处理器皆是K75核心,800MHz的Athlon处理器即已采用0.18微米铝工艺,晶圆面积为102平方厘米,比起采用0.25微米线程制造的旧款式Athlon处理器,800MHz款式发热更低。
      由AMD公布的Athlon处理器与Pentium Ⅲ处理器效能测试数据显示,在Business Winstone 99(Windows NT 4.0)部分,Athlon 800MHz的测试值是42.5,Athlon 750MHz是41.4,Pentium Ⅲ 733MHz是41.3;在WinBench 99CPUmark 99部分,Athlon 800MHz的测试值是71.9,Athlon 750MHz是67.9,而Pentium Ⅲ 733MHz是65.8;在WinBench 99 FPU WinMark部分,Athlon 800MHz的测试值为4,370,Athlon 750MHz为4,103.3,Pentium Ⅲ 733MHz为3,890。
      因此AMD把Athlon处理器的定位,锁定在Xeon的等级,在价位上则定位在Xeon到PentiumⅢ之间,希望能打入商业、高阶工作站、服务器的市场,这应该是很具竞争力的市场策略。

 

 

                           [上一页]  [我要发言]  [下一页] [返回]

 

 

 

在线服务:|关于我们|广告服务|联系我们|您的建议


小熊在线公司版权所有
Copyright © 1999-2000