第2章 数据表示、寻址方式与指令系统

2.1 数据表示

2.1.1 数据表示与数据结构

数据表示:能由计算机硬件直接识别和引用的数据类型,表现在它有对这种类型的数据进行操作的指令和运算部件。

数据结构:应用中药用到的各种数据元素或信息单元之间的结构关系

数据结构是通过软件映像,变换成计算机中所具有的数据表示来实现的。

2.1.2 高级数据表示

1 自定义数据表示

(1)标识符数据表示

类型标志 + 数据值
将数据类型与数据本身直接联系在一起。

主要优点:

  • 简化了指令系统和程序设计
  • 简化了编译程序
  • 便于实现一致性校验
  • 能由硬件自动变换数据类型
  • 支持数据库系统的实现与数据类型无关的要求
  • 为软件调试和应用软件开发提供了支持

两个问题:

  • 每个数据字因增设标识符,会增加程序所占的主存空间
  • 采用标识符会降低指令的执行速度
(2)数据描述符

数据描述符是与数据分开存放,用于描述索要访问的数据是整块的还是单个的,访问该数据块或数据元素索要的地址以及其他信息等。主要用于向量、数组、记录等数据。

描述符
101   各种标志位  长度  地址
数据
000  数据

2 向量、数组数据表示

增设向量、数组数据表示,组成向量机

引入向量、数组数据表示不止能加快形成元素地址,更重要的是便于实现把向量各元素成块预取到中央处理机,用一条向量、数组指令流水或同时对整个向量、数组高速处理。用硬件判断下标是否越界,并让越界判断和元素运算并行。

3 堆栈数据表示

有堆栈数据表示的计算机称为堆栈计算机

堆栈计算机表现于:

  • 由高速寄存器组成的硬件堆栈,并附加控制电路,让它与主存中的堆栈区在逻辑上构成整体,使堆栈的访问速度是寄存器的,容量是主存的
  • 有丰富的堆栈操作指令且功能很强,可直接对堆栈中的数据进行各种运算和处理
  • 有力地支持了高级语言程序的编译
  • 有力地支持了子程序的嵌套和递归调用。子程序调用另一子程序称嵌套调用,子程序直接或经子程序间接调用自己称直接或间接递归调用。

2.1.3 引入数据表示的原则

原则1: 看系统的效率是否有显著提高,包括实现时间和存储空间是否有显著减少

原则2:看引入这种数据表示后,其通用性和利用率是否提高

2.1.4 浮点数尾数基值大小和下溢处理方法的选择

1 浮点数尾数基值的选择

rm: 浮点数尾数的基值,比如2、4、8、16等
阶码p:浮点数尾数的总数位(小数点后有几位阶码就是多少),尾数右移一个数位则加1,大多题目中,p其实代表的是阶值的位数(bit数)
m:计算机位数,比如8位计算机则为8
[log2 rm]: 浮点数尾数的计算机位数,意思为rm进制的一阶占几个bit位
m’:浮点数尾数的数位, m’=m/log2 rm

如在二进制下,1.0010101 * 2 ^ 100,rm为2,p为100,m和计算机相关,log2 rm为 1,若m为8,m’为8

如在十进制下,18.625,rm为10,log2 rm为4,若m为8,m’为2

得到的结论:

  • 可表示数的范围:基值越大,可表示数的范围越大
  • 可表示数的个数:基值越大,可表示数的个数越多
  • 数在数轴上的分布:基值越大,数轴上分布越稀
  • 可表示的精度:基值越大,精度越低
  • 运算中的精度损失:基值越大,精度的损失越小
  • 运算速度:基值越大,运算速度越高

2 浮点数尾数的下溢处理方法

  • 截断法:将尾数超出计算机字长的部分截去。实现简单,最大误差大,平均误差大
  • 舍入法:规定字长外增加一位附加位,下溢处理时附加位加1。实现简单,最大误差小,平均误差接近于0
  • 恒置1法:最低位恒置为1。实现简单,平均误差接近0,最大误差最大,比截断法还大
  • 查表舍入法:用ROM或PLA存放下溢处理表,处理时查表。速度快,平均误差可调节到0.去电是硬件投入大。

2.2 寻址方式

定义:指令按什么方式寻找(或访问)到所需的操作数或信息的。

2.2.1 寻址方式的三种面向

  • 面向主存的寻址:面向主存的寻址主要访问主存,少量访问寄存器
  • 面向寄存器的寻址:主要访问寄存器,少量访问主存和堆栈
  • 面向堆栈的寻址:主要访问堆栈,少量访问主存和寄存器

2.2.2 寻址方式在指令中的指明

  • 占用操作码中的某些位来指明
  • 不占用操作码,而是在地址码部分专门设置寻址方式位字段指明

2.2.3 程序在主存中的定位技术

  • 逻辑地址:程序员编程用的地址
  • 主存物业地址:程序在主存中的实际地址

定位技术有

  • 静态再定位:在目的程序装入主存时,由装入程序用软件方法把目的程序的逻辑地址变换成物理地址,程序执行时,物理地址不再改变,称这种定位技术为静态再定位
  • 动态再定位:在执行每条指令时才形成访存物理地址的方法称为动态再定位
  • 虚实地址映像表:查表映射

2.2.4 物理主存中信息的存储分布

信息在存储器中按整数边界存储:为了使任何时候所需的信息都只用一个存储周期访问到,要求信息在主存中存放的地址必须是该信息宽度(字节数)的整数倍。

2.3 指令系统的设计和优化

2.3.1 指令系统设计的基本原则

考虑:如何有利于满足系统的基本功能;有利于优化计算机的性能价格比;有利于指令系统今后的发展和改进。

步骤:

  • 1.根据应用,初拟出指令的分类和具体的指令
  • 2.试编出该指令系统设计的各种高级语言的编译程序
  • 3.对各种算法编写大量的测试程序并进行模拟测试,看指令系统的操作码和寻址方式效能是否都比较高
  • 4.将程序中高频出现的指令串复合改成一条强功能新指令,即改用硬件方式实现;而将频度很低的指令操作改成用基本的指令组成的指令串来完成,即用软件方式实现。

非特权指令:程序员和系统程序员都可以使用。
特权指令:只供系统程序员使用。

编译程序设计者对指令系统设计要求:

    1. 规整性。对相似的操作做相同的规定。
    1. 对称性。
    1. 独立性和全能型。
    1. 正交性。
    1. 可组合性
    1. 可扩充性

系统机构设计者对指令系统的要求:

    1. 指令码密度适中
    1. 兼容性
    1. 适应性

2.3.2 指令操作码的优化

指令=操作码+地址码

就指令格式的优化来说,是指如何用最短的位数来表示指令的操作信息和地址信息,使程序中指令的平均字长最短。

研究操作码的优化表示主要是为了缩短指令字长,减少程序总位数及增加指令字能表示的操作信息和地址信息。

哈夫曼编码,构造哈夫曼树

依次选最小的两个,加起来的父节点值再加入原序列,依次执行下去,然后小的那边用1,大的那边用0,最后从根节点到叶节点的值,就是对应的哈夫曼编码。

扩展操作码编码

在哈夫曼编码的基础上,将码长整合成少量的几个码长。原则是高概率的用短码,低概率长码。

15/15/15编码法:4/4/4,前面每分块最后一个1111用来给后面的作拓展
8/64/512编码法:3/6/9,前面每块分块的第一位1的各个值用来给后面用来拓展

2.3.3 指令字格式的扩展

指令字格式优化的措施有:

    1. 采用扩展操作码,以缩短操作码的平均码长
    1. 采用诸如基址、变址、相对、寄存器、寄存器间接、段式存放、隐式指明等多种寻址方式,以缩短地址码的长度,并在有限的地址长度内提供更多的地址信息
    1. 采用0、1、2、3等多种地址制,以增强指令的功能,这样从宏观上就越能缩短程序的长度,并加快程序的执行速度
    1. 在同种地址制内再采用多种地址形式
    1. 在维持指令字在存储器中按整数边界存储的前提下,使用多种不同的指令字长度

2.4 指令系统的发展和改进

2.4.1 两种途径和方向(CISC和RISC)

CISC:进一步增强原有指令的功能以及设置更为复杂的新指令以取代原先由软件子程序的功能,实现软件功能的硬化。按此方向发展,机器指令系统日益庞大和复杂。称用这种方式设计CPU的计算机为复杂指令系统计算机。C:complex

RISC:通过减少指令种类和简化指令功能来降低硬件设计的复杂度,提高指令的执行速度。按次方向发展,机器指令系统精简。称用这种方式设计CPU的计算机为精简指令系统计算机。R:reduce

2.4.2 按CISC方向发展和改进指令系统

1.面向目标程序的优化实现改进

  • 途径1:通过对大量已有机器的机器语言程序及其执行情况,统计各种指令和指令串的使用频度来加以分析和改进。
  • 途径2:增设强功能复合指令来取代原先由常用宏指令或子程序实现的功能,由微程序解释实现。

2.面向高级语言的优化实现改进

尽可能缩短高级语言和机器语言的语义差距,支持高级语言编译,缩短编译程序长度和编译时间。

  • 途径1:通过对源程序中各种高级语言语句的使用频度进行统计来分析改进
  • 途径2:如何面向编译,优化代码生成来改进
  • 途径3:改进指令系统,使它与各种语言间的语义差距都有同等的缩小
  • 途径4:采用让计算机具有分别面向高级语言的多种指令系统、多种系统结构的面向问题动态自寻优的计算机系统。
  • 途径5:发展高级语言计算机

3.面向操作系统的优化实现改进

主要目标是如何通过缩短操作系统与计算机系统结构之间的语义差距,进一步减少运行操作系统的时间和节省操作系统软件所占用的存储空间。

  • 途径1:通过对操作系统中常用指令和指令串的使用频度进行统计分析来改进。
  • 途径2:考虑如何增设专用于操作系统的新指令。
  • 途径3:把操作系统重频繁使用的,对速度影响大的机构型软件子程序硬化或固化,改为直接用硬件或微程序解释实现
  • 途径4:发展让操作系统由专门的处理机来执行的功能分布处理系统结构

2.4.3 按RISC方向发展和改进指令系统

1.CISC的问题

    1. 指令系统庞大,一般指令在200条以上
    1. 许多指令的操作繁杂,执行速度很低,甚至不如用几条简单、基本的指令组合实现
    1. 由于指令系统庞大,使高级语言编译程序选择目标指令的范围太大,因此,难以优化生成高效机器语言程序,编译程序也太长、太复杂
    1. 由于指令系统庞大,各种指令的使用频度都不会太高,且差别很大,其中相当一部分指令的利用率很低。

2.设计RISC的基本原则

    1. 确定指令系统时,指选择使用频度很高的那些指令,再增加少量能有效支持操作系统、高级语言实现及其他功能的指令,大大减少指令条数,一般使之不超过100条。
    1. 减少指令系统所用寻址方式种类,一般不超过两种。简化指令的格式限制在两种之内,并让全部指令都是相同长度。
    1. 让所有指令都在一个机器周期内完成。
    1. 扩大通用寄存器数,一般不少于32个,尽量减少访存,所有指令只有存(STORE),取(LOAD)指令访存,其他指令一律只对寄存器操作。
    1. 为提高指令执行速度,大多数指令都用硬联控制实现,少数指令采用微程序实现。
    1. 通过精简指令和优化设计编译程序,简单,有效地支持高级语言的实现。

3.设计RISC结构采用的基本技术

    1. 按设计RISC的一般原则来设计
    1. 逻辑实现采用硬联和微程序相结合
    1. 在CPU中设置大量工作寄存器并采用重叠寄存器窗口
    1. 指令用流水和延迟转移
    1. 采用高速缓冲存储器Cache,设置指令Cache和数据Cache分别存放指令和数据
    1. 优化设计编译系统

4. RISC技术的发展

采用RISC的好处

    1. 简化指令系统设计,适合VLSI实现
    1. 提高计算机的执行速度和效率
    1. 降低设计成本,提高系统的可靠性
    1. 可直接支持高级语言的实现,简化编译程序的设计

RISC的问题与不足

    1. 由于指令少,复杂功能需要多条RISC指令才能完成,加重了汇编语言设计的负担,增加了机器语言程序的长度,占用存储空间多,加大了指令的信息流量
    1. 对浮点运算的执行和虚拟存储器的支持随有很大加强,单仍显得不足
  • RISC计算机的编译程序比CISC难写
  • 12
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值