体系结构
文章平均质量分 82
柯基的屁股敲可爱(๑• . •๑)
Let everything go
展开
-
体系结构10_向量处理机
1.什么是向量处理机?具有向量数据表示和相应向量指令的流水线处理机称为向量流水线处理机,也称为向量处理机。与之对应的是标量处理机,不支持向量数据表示,没有提供向量指令。2.实例:一个简单的FORTRAN循环程序 DO 10 i=1,N10 d[i] = a[i]*(b[i] + c[i])(1)水平(横向)处理方式依次计算向量k和d的每个元素.......原创 2020-02-24 20:05:36 · 1218 阅读 · 0 评论 -
体系结构31_机群计算机
目前流行的高性能并行计算机系统结构通常可以分成五类:并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机(MPP)、分布共享存储(DSM)多处理机和机群(Cluster)。其中,起源于20世纪90年代中期的机群结构凭借低廉的价格、极强的灵活性和可扩展性(Scalability),成为近年来发展势头最为强劲的系统结构。机群的基本概念和结构机群:由多台同构或异构的独立计算机通过高...原创 2022-11-25 23:11:09 · 837 阅读 · 1 评论 -
体系结构30_同步性能问题
栅栏(barrier)同步 栅栏强制所有到达该栅栏的进程进行等待,直到全部的进程到达栅栏,然后释放全部的进程,从而形成同步。 栅栏的典型实现是要用两个旋转锁:一个用来记录到达栅栏的进程数,另一个用来封锁进程直至最后一个进程到达栅栏。栅栏的实现中要不停的探测指定的变量,直到它满足规定的条件。栅栏的使用会有些特殊情况,比如操作系统大量的进程要进行同步,要反复使用一个栅栏...原创 2022-11-25 23:10:41 · 612 阅读 · 1 评论 -
体系结构29_多处理机的互联网络
互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络,这些结点可能是处理器、存储模块或者其它设备,它们通过互连网络进行信息交换。在拓扑上,互连网络为输入和输出两组结点之间提供一组互连或映象(mapping) 互连网络的拓扑可以采用静态或动态的结构。静态网络由点和点直接相连而成,这种连接方式在程序执行过程中不会改变。 动态网络是用开关通道实现的...原创 2022-11-25 23:10:07 · 1258 阅读 · 1 评论 -
体系结构28_多处理机(2)
对称式共享存储器体系结构多处理机Cache一致性 **多个处理器共享一个存储器 **当处理器规模较小时,这种机器十分经济 **支持对共享数据和私有数据的Cache缓存 私有数据供一个单独的处理器使用,而共享数据供多个处理器使用 ** 共享数据进入Cache产生了一个新的问题: Cache的一致性问题(1)不一致产生的原因(Cac...原创 2022-11-25 23:09:38 · 1165 阅读 · 1 评论 -
体系结构27_多处理机(1)
单处理机的发展正在走向尽头?并行处理机在未来将会发挥更大的作用。1.获得超过单处理器的性能,最直接的方法就是把多个处理器连在一起。2.自1985年以来,体系结构的改进使性能迅速提高,这种改进的速度能否持续下去还不清楚,但通过复杂度和硅技术的提高而得到的性能的提高正在减小3.并行计算机应用软件已有缓慢但稳定的发展重点: 中小规模的机器(处理器的个数<100)...原创 2022-11-25 23:08:41 · 537 阅读 · 1 评论 -
体系结构26_输入输出系统(3)
盘阵列(RAID)盘阵列容量大、速度快、可靠性高、造价低廉。它是目前解决计算机I/O瓶颈的有效方法之一,有着广阔的发展前景。盘阵列有多种组织方式:RAID 0 亦称数据分块(Striping),即把数据分布在多个盘上,实际上是非冗余阵列,无冗余信息。严格地说,它不属于RAID系列。RAID 1亦称镜像盘,使用双备份磁盘RAID 2位交叉式海明编码阵...原创 2022-11-25 23:07:07 · 439 阅读 · 1 评论 -
体系结构24_输入输出系统(1)
存储设备磁盘 磁盘始终占据着后备存储器的主宰地位。原因有二: 一是磁盘一直是虚拟存储器技术的物质基础,执行程序时,磁盘用作为交换缓冲区 二是关机时,磁盘作为操作系统和所有应用程序的非易失性的驻留介质磁盘系统的转速一般在每分钟3600转到15000转之间,即3600rpm ~ 15000rpm磁道(每个盘片有5000 ~ 30000条磁道)扇区(每条磁道分为1...原创 2021-08-23 14:38:53 · 282 阅读 · 0 评论 -
体系结构23_虚拟存储器
...系统被设计成将主存储器和后备存储器组合在一起,在程序员看来好像只有一级存储,必须进行的地址变换是自动完成的。 ...原创 2021-07-17 14:07:28 · 199 阅读 · 1 评论 -
体系结构22_主存
存储层次的性价比特征 速度越快,每位价格就越高 容量越大,每位价格就越低 容量越大,速度越慢主存的主要性能指标:延迟和带宽 以往:Cache主要关心延迟,I/O主要关心带宽 现在:Cache关心两者本节讨论几种提高主存性能的存储器组织技术,在下面的讨论中,以处理Cache失效为开销例来说明各种存储器组织结构的好处。为了减少失效开销Tm,应该:...原创 2021-07-15 10:16:01 · 825 阅读 · 2 评论 -
体系结构21_减少Cache失效开销和命中时间
减少Cache失效开销方法:写缓冲及写合并让读失效优先于写子块放置技术请求字处理技术多级Cache非阻塞Cache技术写缓冲及写合并1.写直达Cache中,因为所有的写请求都必须发送到下级存储层次中,所以经常使用一个写缓冲来降低失效开销2.如何提高写缓冲的效率和利用率 写合并3.在写回法Cache中,也可采用写缓冲器让读失效优先于写1...原创 2021-02-26 22:47:59 · 2705 阅读 · 0 评论 -
体系结构20_降低Cache失效率方法(2)
硬件预取技术1.指令和数据都可以预取2.预取内容即可放入Cache,也可放在外缓冲器中 例如:指令流缓冲器3.预取效果(1)Joppi的研究结果 指令预取:(4KB,直接映象Cache,块大小=16字节) 1个块的指令流缓冲器:捕获15%~25%的失效 4个块的指令流缓冲器:捕获50% 16个块...原创 2021-02-26 22:46:26 · 370 阅读 · 0 评论 -
体系结构19_降低Cache失效率的方法
1.三种失效(3C)(1)强制性失效(Compulsory miss) 当第一次访问一个块时,该块不在Cache中,需从下一级存储器中调入Cache,这就是强制性失效 (冷启动失效,首次访问失效)(2)容量失效(Capacity miss) 如果程序执行时所需的块不能全部调入Cache中,则当某些块被替换后,若又重新被访问,就会发生失效。这种失效称为容量失效...原创 2021-02-26 22:46:01 · 3293 阅读 · 0 评论 -
体系结构18_存储层次的性能分析
实例例一:DEC的Alpha AXP21064中的内部数据Cache1.简介 容量:8KB 块大小:32B 块数:256 映像方法:直接映像 “写”策略:写直达-不按写分配 写缓冲器大小:4个块2.结构图3.工作过程 (1)“读”访问命中 (2)“写”访问命中 失效情况下的操作4...原创 2021-02-26 22:45:36 · 794 阅读 · 0 评论 -
体系结构17_Cache基本知识
映像规则1.全相联映像 全相联:主存中的任一块可以被放置到Cache中的任意一个位置。 对比:阅览室位置-----随便坐 特点:空间利用率最高,冲突概率最低,实现最复杂2.直接映像 直接映像:主存中的每一块只能放置到Cache中唯一的一个位置(循环分配) 对比:阅览室位置----只有一个位置可以坐 ...原创 2021-02-26 22:45:03 · 619 阅读 · 0 评论 -
体系结构16_存储器的层次结构
从单级存储器到多级存储器处理器性能与存储系统性能之间存在巨大差异。1.为什么? (1)主存储器与CPU速度差距越来越大,存储墙问题严重制约着计算机性能的提升。 (2)系统与应用的规模不断扩大,需要更大的存储器来支撑程序的运行 (3)各类存储器的容量/速度/价格不可兼得,如SRAM、DRAM、磁盘等,凭现有单种存储器件,无法构建一个可行的存储系统。SRAM速度基本和...原创 2020-10-27 14:01:19 · 320 阅读 · 0 评论 -
体系结构15_多指令流出技术
前面的解决办法都使CPI的值接近1,而不能达到1多指令流出技术1.多指令流出处理器 - 实现一个时钟周期内流出多条指令时 -达到CPI小于12.多流出处理器2种基本结构 超标量(Superscalar) a.超标量每个时钟周期流出的指令数不定 b.可以编译器静态调度,也可以硬件动态调度 超长指令字(VLIW、Very long I...原创 2020-10-27 14:00:57 · 1064 阅读 · 0 评论 -
体系结构14_控制相关的动态解决技术
分支预测缓冲、分支目标缓冲两种解决方法动态分支预测的两个理由1.n流出的处理器加速上限为n倍2.Amdahl定律提示:在较低CPI机器上,控制相关导致的空转对机器性能影响大前面解决控制相关的静态策略需要编译器将一条或多条指令移动到流水线产生的分支延迟槽中关于分支预测策略的两部分工作1.预测的分支是否成功2.执行分支目标指令分支预测的效率1.预测的准确率2...原创 2020-10-27 14:00:22 · 1481 阅读 · 0 评论 -
体系结构13_Tomasulo算法
产生背景1.IBM 360/91比CDC6600晚三年推出 -商业计算机使用Cache技术之前2.整个360系列仅一个指令系统和编译器(公司在上面花了巨大的财力,所以不希望指令系统一直改) -要求具有很高的浮点性能,但不是通过高端机器的专用的编译器实现 -只有四个双精度浮点寄存器,编译器调度的有效性受到很大限制 -访存时间和浮点计算时间都很长 -可支持循环的多...原创 2020-02-25 18:14:26 · 2038 阅读 · 0 评论 -
体系结构12_指令的动态调度
编译器本质上通过每个循环迭代中寄存器重命名来展开循环硬件也可以通过寄存器重命名和乱序执行来获得同样的效果动态调度 - 记分牌 - Tomasulo's 算法冒险的检测和调度1.如果存在数据相关,硬件检测机制会做如下的事情知道相关消除动态调度 -暂停指令 -停止取指令和发射指令2.静态调度(开始于60s,流行于80s)消除动态调度 软件来...原创 2020-02-25 18:13:58 · 1625 阅读 · 0 评论 -
体系结构11_指令级并行
指令级并行的概念 指令级并行:当指令之间不存在相关时,它们在流水线中是可以重叠起来并行执行的。这种指令序列中存在的潜在并行性称为指令级并行。 Instruction-Level Parallelism ,简记为ILP如何知道指令之间可以并行?硬、软件如何支持指令级并行?如何研究这些问题? -硬件技术或者软件技术都可以提高指令级并行性 -必须要硬件技术和软件技术互相配...原创 2020-02-25 18:13:36 · 423 阅读 · 0 评论 -
体系结构9_MIPS R4000
MIPS R4000的整型流水线1.指令集:64位MIPS-3指令集2.MIPS R4000流水线结构 超流水结构(superpipeling) 访存操作流水化3.指令序列在流水线中的重叠执行过程 定向+插入暂停周期4.载入延迟为两个时钟周期5. 指令序列在流水线中的执行时空图6.R4000流水线的定向路径远多于M...原创 2020-02-24 20:04:57 · 948 阅读 · 0 评论 -
体系结构8_流水线技术
流水技术 将一重复的时序过程分解为若干子过程,每个子过程都可有效地在其专用功能段上与其它子过程同时执行,这种技术称为流水技术。分类:功能分类:单功能流水线(是指只能完成一种固定功能地流水线),例如功能单元流水线 多功能流水线(是指各段可以进行不同的连接,从而完成不同的功能),例如 TI ASC的多功能流水线按同一时间内流水段的连接方式...原创 2020-02-24 20:04:27 · 2116 阅读 · 0 评论 -
体系结构7_指令系统
主要介绍MIPS指令系统MIPS指令系统结构Load/Store型指令集结构 (MIPS所有ALU操作的原操作数和目的操作数都放在寄存器中,只能通过Load/Store指令访问存储器)MIPS是一种多元指令集结构 a.体现了当今多种机器(AMD29K、DEC station 3100、HP850、IBM 801、Intel i860、MIPS M/120A、M...原创 2020-02-19 11:09:54 · 179 阅读 · 0 评论 -
体系结构6_指令集结构和MIPS指令集
寻址方式寻址实际上是从形式地址到实际地址的转换。形式地址由指令描述,实际地址也称为有效地址有效地址指明的是存储器单元的地址或寄存器地址寻址技术必须加速有效地址生成分为 寄存器寻址 、立即数寻址、偏移寻址、寄存器间接寻址、索引寻址(基址变址寻址)、直接寻址(绝对寻址)、存储器间接寻址、自增寻址、自减寻址、缩放寻址获得一个操作数有多种方法,编译器设计时候会选择一定的方式。指令系...原创 2020-02-19 11:09:28 · 231 阅读 · 0 评论 -
体系结构5_指令集
概述指令集:一些指令的集合,每条指令都是直接由CPU硬件执行指令的表示方法:1.二进制格式 2.物理存储空间组织方式是位、字节、字和多字等当前的指令字长有:16、32、64位可变长格式和固定长度格式 绝大多数RISC处理器的每条指令的长度都是固定的,像MIPS处理器每条指令的长度是32位的,X86是不固定的指令的特点1.指令的操作十分简单,其操作由操作码编码表示...原创 2020-02-19 11:06:14 · 443 阅读 · 0 评论 -
体系结构4_系统设计与分析
并行处理技术的发展并行性概念 1.指令级并行 2.线程级并行 3.任务级/过程级并行(操作系统中会涉及)提高并行性的技术途径 1.时间重叠:不同部件在同一时间完成不同任务的不同步骤,典型的如流水线 2.资源重复:一个加法器不够的时候两个加法器,一个处理器不够的时候两个处理器... 3.资源共享:原始的目的是提高资源的利用效率,如打印机并行计算的应用需求 典型应用:数...原创 2020-02-15 10:23:59 · 124 阅读 · 0 评论 -
体系结构3_系统设计与分析
1. 成本与价格2.基准测试程序 性能与测试程序的执行时间有关,那么用什么做测试程序呢? 五类测试程序 I. 真实程序 II.修正的(或者脚本化)应用程序 III.核心程序 IV.小测试程序 V.合成测试程序 测试程序包(组件...原创 2020-02-15 10:23:38 · 173 阅读 · 0 评论 -
体系结构2_系列机和兼容
系列机系列机(family machine)是具有相同体系结构,但组成和实现不同的一系列不同型号的计算机系统。 IBM公司在推出IBM S360时首次提出的系列机的概念,被认为是计算机发展史上一个重要里程碑。 各计算机厂家仍按系列机研发产品现代计算机不但系统系列化,其构成部件和软件也系列化 如微处理器(CPU)、硬盘、操作系统、高级语言等...原创 2020-02-15 10:23:15 · 2981 阅读 · 0 评论 -
体系结构_1_前言
往后体系结构内容笔记来自https://www.bilibili.com/video/av19929862?from=search&seid=7414140685790867958不同年代计算机体系结构研究的变化年代 一些重要的研究内容 典型计算机 1940年代 程序控制计算机、存程序计算机 ENIAC、EDVAC ...原创 2020-02-15 10:22:43 · 181 阅读 · 0 评论