关闭

CPU的主要技术指标

标签: CPUcpu主要技术指标
1436人阅读 评论(0) 收藏 举报
分类:
一、CPU的物理结构

1.CPU的生产过程

         CPU发展的30多年来,CPU的制造工艺技术也得到长足的发展。CPU是由数百万只在显微镜下才看得见的晶体管组成的,并经过照相平版印刷技术最终蚀刻在一块磨光了的、只有大拇指甲盖大小的硅片上,并且还在不断地缩小。CPU的生产过程可以简单地归纳成以下几个步骤。


第一步:切晶圆。


第二步:影印(Photolithography)。


第三步:蚀刻(Etching)。


第四步:分层。


第五步:离子注入(IonImplantation)。


第六步:不断重复以上过程。


2. CPU的基本组成


         CPU中的晶体管用来存储表示0或者1的电荷,构成了计算机的二进制语言。成组的晶体管连在一起存储这些数据就能完成各种各样的运算任务,并且借助于一个石英的晶体钟来协调行动,使其任务一致和同步。这就是计算机内时钟的用途。


         存储器中的信息可以是数据,也可以是指令。对于由最简单的信息构成的数据,CPU只需要四个部分来实现对数据的操作:指令、指令指示器、寄存器、算术逻辑单元,另外CPU还包括一些协助基本单元完成工作的附加单元等,如表2-1所示。


基本组成单元部分

   

指令

指示CPU处理数据

指令指示器

告诉CPU它所需要的指令放在内存中的哪个位置

寄存器

CPU内部的临时存储单元,保存等待处理的数据或是已经处理过的数据(如把两个数相加后的结果)

ALU(算术逻辑单元)

CPU的运算器,执行指令所指示的数学和逻辑运算

取指器

RAM或者CPU上的存储区取出指令

解码器

从取指器中取出指令,把它翻译成CPU所能使用的计算机语言,并确定完成该指令所需要的步骤

控制器

管理和控制CPU的所有操作,如告诉ALU什么时候开始计算,取指器什么时候取一个01值,以及解码器什么时候把该值翻译成一条指令

FPU(浮点运算单元)

处理非常大的数和非常小的数


        ALUFPUCPU中不可缺少的组成部分。为提高运算能力,在CPU内部增设了额外的ALU,希望增加一倍的处理能力,并另外增加了FPUFPU能够处理范围非常大的数。对于计算机来说,若没有这两个部件,完成图形图像、动态模拟等工作就非常困难。

        为提高CPUL2 Cache(二级高速缓存)间的数据交换速度,IntelPentium Pro起将原来设置在计算机主板上的高速缓存控制电路和L2 Cache集成到CPU芯片上。这样CPU内核与高速缓存之间的数据交换就不再经过外部总线而直接通过CPU内部的缓存总线进行,使CPU内核与内存、CPU与高速缓存之间的数据交换通道分离,形成了双总线架构模式。




二、CPU的主要技术指标

1.CPU的工作电压

       工作电压是指CPU正常工作时所需的电压。工作电压越高,CPU的发热量越大,工作越不稳定,甚至会造成死机或烧坏CPU。早期386486的工作电压一般为5VPentium的工作电压是3.5V3.3V2.8V1.6V等。随着CPU的制造工艺与主频的提高,CPU的工作电压还在逐步下降。低电压的CPU的芯片总功耗降低了,使得系统的运行成本就相应降低,这对于便携式和移动系统来说,可以让电池工作更长的时间,也使电池的使用寿命大大延长。功耗降低还可使发热量减少,让CPU与系统配合更好。可以说降低电压是CPU主频提高的重要因素之一。

       586系列以后的CPU按工作电压可分为两种,一种是单电压CPU,另外一种则是双电压CPU。单电压CPUIntel Pentium系列的P54CAMD-K5Cyrix6x86等系列。双电压CPU则有Intel MMX P55CPentiumAMDK6Cyrix6x86M2等系列。而这些双电压CPU所使用的工作电压则可以被区分成Vcore(内核电压)和VioI/O电压)两个部分。

2.CPU的生产工艺

        表明CPU性能的参数中常有“工艺技术”一项,如“0.35mm”或“0.25mm”。目前生产CPU主要采用CMOS技术,这种技术生产CPU采用“光刀”加工各种电路和元器件,并采用金属铝沉淀在硅材料上,然后用“光刀”刻成导线连接各元器件。光刻的精度一般用微米表示,精度越高就可在同样体积的硅材料上生产更多的元件,加工出更细的连线,CPU工作主频就可以更高。   

3.CPU的位、字节和字长

        CPU可以同时处理的二进制数据位数是其最重要的一个品质标志。通常所说的16位机、32位机就是指该微机中的CPU可以同时处理16位、32位的二进制数据。现在的CPU都是64位机。64位微处理器一次可以处理8个字节的信息。

4.CPU的主频、外频和运算速度

1)主频

      CPU的“工作频率”又称“主频”或“内频(InternalClock)”,是CPU内核电路的实际运行频率,现在常用的为2.4GHz左右。从486DX2开始,CPU主频等于外频乘倍频系数(后面介绍)。主频的高低直接影响CPU的运算速度,是衡量CPU性能高低的重要技术参数。

      

      当然CPU的运算速度主要还要看CPU的流水线的各方面的性能指标。主频是CPU性能表现的一个方面,而不代表CPU的整体性能。比如AMD公司采用了更加模糊的命名方式,企图让消费者淡化以主频率计算性能的观念。比如Athlon 3000+,它的频率有可能是2.20GHz,也有可能是2.0GHz。对于CPU的性能还要参考其他主要参数。

2)外频

        在计算机的主板上,以CPU为主,内存和各种外围设备为辅,有许多设备要共同在一起工作。这些设备之间的联络,数据的交换,都必须正确无误、分秒不差。因此,它们必须要有一个固定的时钟来做时间上的校正、协调或者参考。这时钟由主板上的时钟发生器(Clock GeneratorClock Gen.)产生,就是所谓的外频。常见的指标多为133200MHz。时钟发生器的品牌,大致有ICSICWORKSWinBond等。

        由于计算机技术的飞速发展,CPU的速度也不断提升,而和它搭配的内存与外围设备的速度却跟不上,造成彼此速度搭配上明显的差异。为使它们能协调工作,CPU就得放慢脚步,这就限制了CPU的发展。于是制造厂商规定了一个公式,即“外频×倍频=内频”,规定外频即CPU用来与其他外围设备共同工作的速度。外频也称为CPU的外部时钟(External Clock)或总线时钟(BUS Clock)。从486DX2开始,CPU的内核工作频率和外频就不一致了。

        将系统时钟倍频后所得到的时钟信号作为CPU的内核工作时钟即CPU主频,例如IntelPentium 300400500三款CPU的外部时钟皆为100MHz,其差别只是CPU内部倍频系数不同而已。300MHz(内频)=100MHz(外频)×3(倍频)。

3)倍频系数(ClockMultiplier Factor

        由上面的介绍我们知道,CPU内部真正的工作时钟(主频)是外部时钟(外频)的倍数,这个所谓的“倍数”就是“倍频系数”。倍频系数越高,主频就越高。

4)前端总线(FSB-FrontSystem Bus

         前端总线是指北桥芯片与CPU间数据传输的总线,是CPU跟外界沟通的惟一通道,处理器必须通过它才能获得数据或将运算结果传送出其他对应设备。前端总线的速度越快,CPU的数据传输就越迅速。前端总线的速度主要用前端总线的频率来衡量,取决于两个因素:一是总线的物理工作频率(即外频),二是有效工作频率(即FSB频率),它直接决定了前端总线的数据传输速度。IntelAMD采用了不同的技术,Intel处理器的FSB频率跟外频的关系是:FSB频率=外频×4AMD的则是:FSB频率=外频×2

        通过介绍可以明白外频与前端总线频率的区别:前端总线的速度是指数据传输的速度,外频是CPU与主板之间同步运行的速度,即100MHz外频是指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8Byte/bit=800MB/s

5)运算速度及制约主频、外频提高的因素

         CPU的运算速度可用MIPS来表示,即“百万指令集每秒”的意思。它取决于主频,一般1.5GHz主频CPU的运算速度为1700MIPS。但计算机的整体运算速度不仅取决于CPU的运算速度,还取决于存储系统、显示系统等设备,这些分系统也需特定频率的时钟信号来规范运行,这样除了CPU主频和系统时钟(外频)外,还有ISAPCI总线和AGP显示接口的时钟,这些时钟的频率都低于系统时钟。CPU与各个周边总线、设备就像一个集体,只有相互之间配合协调,才能将整体性能发挥出来。

       提高CPU主频和外频可以提高计算机系统的运算速度,但要提高这些指标又有一些制约因素。

       首先,提高CPU主频要受到生产工艺的限制。CPU是在半导体硅片上制造的,硅片上的元件之间需要导线进行连接,在高频状态下要求导线越细越短越好,这样才能减小导线分布电容等干扰以保证CPU运算正确,因此CPU的生产工艺很关键,比如0.25mm可以使CPU的主频达到400MHz0.18mm可以达到700MHz0.13mm可以达到2GHz;随着工艺技术的提高到90nm65nm时,CPU的工作主频也就更高。

        其次,提高外频受到运行速度较慢的外部器件的制约。计算机外设的发展速度远跟不上CPU的发展速度,比如硬盘,尽管硬盘技术不断更新,但硬盘接口的工作频率远远低于CPU的频率。一旦系统时钟提高过快,硬盘的工作则可能会无法正常进行,为此还提出了“分频”的概念。

        分频技术是通过主板的北桥芯片将CPU外频降低,然后再提供给各板卡、硬盘等设备。

         用外频除以分频系数,便能得到PCI等外设的工作频率。在主板的外频变化时,PCI等外设的工作频率能够固定在标准频率。早期的外频为66MHz时是PCI设备12分频,AGP设备不分频;后来的外频为100MHz时是PCI设备13分频,AGP设备23分频(有些100MHz的北桥芯片也支持PCI设备14分频);目前的北桥芯片一般都支持133MHz外频,即PCI设备14分频、AGP设备12分频;在CPU外频高达200MHz,支持六分频的主板,即200除以6,就可得到PCI的标准频率33MHz

        总之,在标准外频(66MHz100MHz133MHz200MHz)下,北桥芯片通过分频技术使PCI设备工作在33MHzAGP设备工作在66MHz。外频改变的同时也改变了PCI等扩展总线的时钟频率,必然影响这些接口上的外部设备的运行状态,这也是制约提高系统时钟频率的一个因素。

三、 CPU的缓存

L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。

L2 Cache(二级缓存)是CPU的第二层高速缓存,设置L2Cache的目的是弥补L1 Cache(一级高速缓存)容量的不足,以最大程度地减小内存对CPU运行造成的延缓。

L3 Cache(三级缓存)早期是外置集成在主板上的,现在都是内置了。而它的实际作用是进一步降低内存延迟,同时提升大数据量计算时处理器的性能。

四、 CPU的超频技术简介

1.什么是超频

      超频就是通过提高CPU的外频或者倍频的方法来提高系统的数据传输量和运算速度,进而全面提高计算机系统的整体性能。通过超频可在不增加任何投资的情况下,实现系统升级,提高系统性能。

2.如何超频

      超频首先可从提高外频开始,采用的方法是逐一往上调。调的方法也有两种:

      一种是对照主板说明书,在关机的情况下调整主板上的跳线或DIP开关,调整到所需的频率后重新开机,看计算机能否正常启动并稳定运行。

      另外一种方法是通过BIOS设置更改CPU倍频或外频。

       超频损害了CPU生产商的利益,Intel对其多数CPU产品进行了“锁频”技术处理,即采用固定倍频系数的方法限制用户对CPU超频。这样一来,超频者只有调整外频一种办法了,然后CPU的,如果CPU超频后系统不稳定,就可以适当调高CPU工作电压。但是加电压的副作用很大,首先CPU发热量会增大,其次电压加得过高很容易烧毁CPU,所以加电压时一定要慎重,一般以0.025V0.05V或者0.1V步进向上加就可以了。而多数AMD的倍频都没有锁定,可以通过修改倍频的方法来进行超频。

       采用提高CPU倍频系数的方法进行超频时,超频能否成功仅取决CPU本身的性能和质量;而采用提高系统时钟方法对已经“锁频”的CPU进行超频时,超频能否成功则不光取决于CPU的性能和质量,还取决于系统内存、硬盘和显示卡等部件的性能和质量。因为外频提高后,CPU内部的L2 Cache的工作频率也相应被提高,L2 Cache的访问速度有一定限制,当系统时钟频率提高到一定程度,L2 Cache就可能无法正常工作。所以在对CPU进行超频运行时必须要考虑到这些因素,适可而止。

3.超频后有可能出现的问题和解决方法

      CPU的工作状态是由输入CPU的电压决定的。输入CPU的电压波形一般呈梯形,假设在波峰和波谷之间存在一个点,在这点之上(即电压高)和之下(即电压低)CPU内部分别处于HighLow状态,达到这两种状态后分别需要稳定地保持一定时间,CPU才能正常工作。而将频率提高后,电压上升和下降所需的时间不变,而处于波峰和波谷稳定状态的时间被缩短了,最终导致CPU无法正确区分HighLow的状态。这就是超频后计算机工作不稳定的根本原因。

       最常用的解决方法是提升输入电压,但会产生一系列新的问题。首先电路本身并不是为高电压的环境所设计,无节制地提高工作电压最终会使电路无法工作,甚至有可能破坏精密的晶体管。通常,CPU的许可工作电压比额定电压高0.1V左右,过多提升电压会缩短CPU的寿命,所以,只能往上升一点点。其次,随着CPU工作电压的升高,发热量会增大,散热不好也会造成CPU工作不正常

      若想超频,选购CPU时应注意选择实力强的厂商及超频空间较大的产品。另外,还要选择稳定的主板,布局结构要合理,有利于散热,北桥芯片上应该有散热片,以增强系统的稳定性,并有较多可供选择的外频等。

       另外当CPU超频在非标准外频时,硬盘、显卡及其他PCI设备同样处于超标准的频率下,长期使用会给这些配件带来一定影响。因此,硬盘、内存、显卡及其他PCI设备在高频下的稳定性同样决定了超频能否成功,应该购买质量较好的名牌产品。

五、 CPU主要技术术语浅析

1.流水线技术和超流水线技术

           流水线(Pipeline)是Intel公司在486芯片中开始使用的。在CPU中由取指令、译码、产生地址、执行指令和数据写回等56个不同功能的电路单元组成一条指令处理流水线。一条x86指令可分成56步,由这些电路单元同时执行,这样在一个CPU时钟周期就能完成一条指令,以提高CPU的运算速度。

       CPU流水线长度越长,不同功能的电路单元越多,运算工作就越简单,处理器的工作频率就越高。CPU的流水线长度很大程度上决定了CPU所能达到的最高频率,于是就有了现在的超流水线技术,例如IntelWillametteNorthwood核心的流水线长度为20步,Prescott核心的Pentium 4流水线长度为30步,而AMDClawhammer K8流水线长度为11步。

2.超标量技术和超线程技术

       超标量(Superscalar)是指在CPU中有一条以上的流水线,并且每时钟周期内可以完成一条以上的指令,这种设计就叫超标量技术。

      超线程(Hyper-ThreadingHT)是一种同步多线程执行技术,采用此技术的CPU内部集成了两个逻辑处理器单元,相当于两个处理器实体,可以同时处理两个独立的线程。通俗说就,是让单个CPU能作为两个CPU使用,从而达到加快运算速度的目的。

3.指令特殊扩展技术

      CPU在基本功能方面的差别并不太大,基本的指令集也都差不多,但是许多厂家为了提升某一方面性能,又开发了扩展指令集,扩展指令集定义了新的数据和指令,能够大大提高某方面数据处理能力,但必需要有软件支持。CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。

      MMXMuti Media Extended(多媒体指令集)的缩写,是Intel公司于1996年推出的一项多媒体指令增强技术,共有57条指令,主要用于增强CPU对多媒体信息的处理,提高CPU处理3D图形、视频和音频信息能力。但由于只对整数运算进行了优化而没有加强浮点方面的运算能力。

       SSEInternet StreamingSIMDExtensions(因特网数据流单指令序列扩展)的缩写,共有70条指令,涵括了MMX3D Now!指令集中的绝大部分功能,特别加强了SIMD浮点处理能力,改善了内存的使用效率,使其速度更快。首次被应用于Pentium中。随后的SSE2包含有144条命令,SSE3包含有13条命令。SSE3是目前最先进、规模最小的指令集,Intel Prescott处理器支持SSE3指令集,AMD在双核心处理器当中加入对SSE3指令集的支持,全美达的处理器也将支持这一指令集。

       SSE4指令集是在Intel Core2处理器中率先推出的。从IntelCore微架构针对SSE指令所作出的修改被称为“Intel Advanced Digital Media Boost”技术来看,SSE4将更注重针对视频方面的优化。

4.多核心

        多核心,也指单芯片多处理器(Chipmultiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较,SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。

5.Core微架构技术

     Core微架构拥有双核心、64bit指令集、4发射的超标量体系结构和乱序执行机制等技术,使用65nm制造工艺生产,支持36bit的物理寻址和48bit的虚拟内存寻址,支持包括SSE4在内的Intel所有扩展指令集。而且它采取共享式二级缓存设计,2个核心共享4MB2MB的二级缓存是。真正的双核。

       基于Core核心的Conroe处理器的流水线从Prescott核心的31级缩短为14级,Core还采用改进后的分支预测设计,这使它拥有更优秀的分支预测能力,避免了流水线周期的浪费。

       Core微架构的最大变化之一,是采用了四组指令编译器,即四组解码单元。这四组解码单元由三组简单解码单元(Simple Decoder)与一组复杂解码单元 ComplexDecoder)组成。Core采用微指令融合技术,可以减少微指令的数目,这相当于在同样的时间   内,它能实际处理更多的指令,显著提高了处理效能。而且,减少微指令的数目还能降低处理器的功耗。

       Core微架构采用大容量的共享式二级缓存。这种设计不仅减少了缓存访问延迟,提高了缓存的利用率,而且还可以使单个核心享用完全的4MB缓存。

       Core微架构提供内存数据依存性预测功能,可在处理器将数据回存内存的同时,预测后继的加载指令是否采用相同的内存地址,并将未采用相同内存地址的后继指令加载到指定位置。而增强的“预先加载机制”可根据应用程序数据的行为,进行指令与数据的预先抓取动作,让所需要的内存地址数据,尽量存放在缓存中,减少读取内存的次数。这些大大改善了内存读取效率,缩短了内存存取的延迟。

       Core微架构具有智能电源管理能力(IntelligentPower Capability),在处理器内各功能单元并非随时保持启动状态,而是根据预测机制,仅启动需要的功能单元。在Core微架构上,新采用的分离式总线(Split Buses)、数字热感应器(Digital Thermal Sensor)以及平台环境控制接口(Platform Environment Control Interface)等技术将带来明显的省电效果,这将大大降低功耗。

      20082010年还会有NehalemGesher等新的“微架构”问世。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:104201次
    • 积分:4923
    • 等级:
    • 排名:第6004名
    • 原创:395篇
    • 转载:14篇
    • 译文:0篇
    • 评论:44条
    最新评论