计算机体系结构 第七章 网络

7 Net

7.1 互联网络基本概念

7.1.1 互连网络的作用

  • 互联网络,由开关元件按照一定拓扑结构核控制方式构成的网络,实现计算机系统中节点之间的相互连接
  • 节点:处理器,存储模块,或者其他设备
  • 互连网络已成为并行处理系统的核心组成部分
  • 互连网络对整个计算机系统的性能价格比有着决定性的影响
    在这里插入图片描述
  • 三大要素:互联结构,开关元件,控制方式

7.1.2 互联函数

  • 互联函数表述 输入端号和输出端号之间一一对应关系, f(x)
  • n = l o g 2 N n = log_2N n=log2N,用n位二进制数来表述N个输入端和输出端的二进制地址,互联函数表示为 f ( x n − 1 x n − 2 . . . x 1 x 0 ) f(x_{n-1}x_{n-2}...x_1x_0) f(xn1xn2...x1x0)

恒等函数
在这里插入图片描述
交换函数:实现二进制地址编码中第k位互反的输入端和输出端之间的连接

在这里插入图片描述
在这里插入图片描述
均匀洗牌函数 shuffle:移动最高位到第0位,实现效果为前后分两半,交叉连接到输出端。

  • 子洗牌(子混洗):之后第 k位进行洗牌

  • 超洗牌(超混洗):只有高k位混洗
    在这里插入图片描述
    蝶式互联函数 Butterfly:输入端二进制编号最高位和最低为互换位置
    在这里插入图片描述

  • 子蝶式: 只在低k位进行互换
    在这里插入图片描述

  • 超蝶式:只在高k位进行互换
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    反序位函数 Bit Reversal: 将输入二年禁止编号位序颠倒
    在这里插入图片描述

  • 子反序位:即把输入端的二进制编号的低k位中各位的次序颠倒过来
    在这里插入图片描述

  • 超反序位: 将二进制编号高k位颠倒
    在这里插入图片描述
    移位函数: 将输入端都错开一定位置后连接到输出端
    在这里插入图片描述
    在这里插入图片描述
    PM2I函数: P和M分别代表加和减,2I表示 2 i 2^i 2i,又称加减 2 i 2^i 2i函数

  • 将输入端都错开一定位置后连接到输出端。
    在这里插入图片描述

7.1.3 互联网络的特性

在这里插入图片描述

7.1.4 互联网络的传输性能参数

在这里插入图片描述

在这里插入图片描述
总延时 = 发送方开销 + 飞行时间 + 消息长度/频带宽度 + 接受方开销

7.2 互连网络的分类

  • 静态互联网络: 给节点之间有固定的连接通路、且在运行中不能改变的网络
  • 动态互联网络:由交换开关组成、可按运行程序的要求动态地改变连接状态的网络

7.3 静态链接网络

1 线性阵列

一种一维的线性网络,其中N个节点传一行
在这里插入图片描述

  • 端点的度: 1
  • 其余节点度:2
  • 直径: N-1
  • 等分宽度:b=1
2 环和带弦环

在这里插入图片描述

  • 对称
  • 节点的度:2
  • 双向环的直径:N/2
  • 单向环直径:N
  • 环的等分宽度 b = 2

在这里插入图片描述
全连接环
在这里插入图片描述

3 循环移数网络
  • 再换上每个节点到与其距离为2的整数幂的节点之间加一条链
    在这里插入图片描述
    在这里插入图片描述
4 树形和星形

在这里插入图片描述
星形:

  • 可靠性比较低,征信节点出故障,整个系统会瘫痪。
5 胖形树

在这里插入图片描述

6 网格形与环网形

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

7 超立方体

在这里插入图片描述

7.4 动态互联网络

7.4.1 总线网络

  • 由一组导线和插座构成,经常被用来实现计算机系统中处理机模块、存储模块和外围设备等之间的互连。
  • 总线只能用于一个源到一个或多个目的啊之间一回处理一次业务
  • 多个模块之间争用总线、或时分总线
    在这里插入图片描述
    特点
  • 结构简单、实现成本低、贷款窄
  • 总线提供公共通路
  • 系统总线通常设置在印刷电路板底板上。处理器板、存储器板和设备接口板都通过插座或电缆插入底板。

解决总线带宽较窄问题;

  • 多总线: 1 为不同功能设置专门总线 2 重复设置相同功能 的总线
  • 多层次总线,按层次的架构设置不同总线,使得不同速度的模块有比较适合的总线连接

7.4.2 交叉开关网络

单级开关网络

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

多级互联网络

MIN multistafe interconnection network

在这里插入图片描述

在这里插入图片描述
ISC 级间连接是固定的

在这里插入图片描述
MIN 的区别在于 开关模块、控制方式、级间互联模式

控制方式

  • 级控制: 每级的所有开关只用一个控制信号控制,同时处在同一种状态
  • 单元控制: 每个开关都有独立的控制信号
  • 部分控制: 第i级所有开关,分别用 i+1个信号控制

级间互联: 均匀洗牌、蝶式、多路洗牌、纵横交叉、立方体连接等

1 多级立方体网络

多级立方体网络包括 STRAN网络间接二进制n立方体网络

  • 两者不同: 仅控制方式 不同,STRAN 网络采用级控制和部分级控制,而间接二进制n立方体网络采用单元控制,具有更大灵活性。
  • 共同点: 都是用二功能(直送、交换)的 2*2开关;当第 i 级
    (0 ≤ i≤ n − 1)交换开关处于交换状态时 第 i 级间采用 C u b e i Cube_i Cubei互联函数

一个N输入的多级立方体网络有log2N级,每级用N/2个2×2开关模
块,共需要log2N×N/2个开关

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2 Omege网络 多级混洗交换网络
  • 88 的Omega网络,每级有 4个4功能的22开关,级间互联采用均匀洗牌的连接方式。

在这里插入图片描述
在这里插入图片描述

3 多级PM2I网络

在这里插入图片描述

  • 可以提供冗余路径,便于电路继承,提高可靠性

在这里插入图片描述

  • 控制三种连接线的信号分别被称为 平控H、下控D和 上控U
    在这里插入图片描述

7.5 阵列处理机

分布式存储器的阵列处理机构形

在这里插入图片描述

  • 各处理单元设有剧本存储器PEM,存放被分布的数据;只能被本处理单元直接访问
  • 控制部件CU设有存放程序和数据的主存储器
  • 整个系统在CU控制下运行用户程序和部分系统程序
  • 处理单元之间可通过互联网络ICN
  • 目前大部分真累处理及是基于分布式存储器模型的系统

集中式共享存储器的阵列处理机构形

在这里插入图片描述

  • 存储器由K个存储体集中组成,经互联网络ICN为全部N个处理单元共享
  • 互联网络用于处理单元和存储体分体之间进行转接而构成数据通路

在这里插入图片描述
在这里插入图片描述 共享主存构形的阵列处理机中并行存储器的无冲突访问

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

7.6 脉动阵列流水处理机

  • 脉动阵列结构有一组吹单元(PE)构成的阵列
  • 每个PE内部就够相同
  • 震雷内所有PE的数据所存收一个时钟控制
  • 运算时,市局在阵列结构中各个PE间沿各自方向同步向前推进

在这里插入图片描述

两种通信方式

在这里插入图片描述

  • 各个PE只接受前一组PE传来的数据,并向后一组PE发送数据
  • 只有位于阵列边缘的处理单元,才与存储器或I/O端口进行数据交互
    在这里插入图片描述

在这里插入图片描述

  • 结构简单、规整,速度快,可扩充,适合超大规模集成电路实现
  • PE见数据通信距离短、规则,施舍拘留和控制流的设计、同步控制简单规则
  • 计算并行性高,通过流水获得很高的运算效率和吞吐率。
  • 减轻了阵列和外界的I/O通信量
  • 脉动阵列的构型与特定计算任务和算法密切相关
  • 通用脉动阵列结构, 关键因素:受阵列结构的通用性及I/O带宽约束所限制的阵列结构的规模大小

7.7 消息传递机制

源节点和目的节点之间没有直接相连的时候,消息需要经过中间节点的转发。寻径,也叫路由。

7.7.1 消息寻径方案

1 消息的格式

消息:节点之间进行通信的逻辑单位

  • 包是包含寻径所需目的地址的基本单位,不同的包可能异步道道目的节点。每个包都分配一个序号,一百年报道大目的节点候能重新组装出消息
  • 包进一步分成更小的长度固定的片,寻径信息和包秀娥好形成包头片,其余为数据片。

在这里插入图片描述

2 消息寻径方式
线路交换
  • 先建立一条物理通路,在传递信息

在这里插入图片描述

  • 优点: 传输带宽大,平均传输延迟较小,使用缓冲区性较小,适合于具有动态和突发性的大规模并行处理数据的传送
  • 缺点:需要频繁地建立源节点到目的节点的物理通路,时间开销会很大
存储转发
  • 包是信息传递的基本单位,从源节点经过一系列中介按揭带你到达目的节点
  • 当一个包到达一个中间结点时,它首先被存放到缓冲区,当所要求的的输出通道和接收结点的包缓冲区可用时,再将它传送给下一个结点
    在这里插入图片描述
  • 优点: 占用物理通路的时间比较短
  • 缺点:包缓冲区打,时延大
虚拟直通
  • 为减少时延,没有必要等到整个消息全部缓冲后再进行路由选择,只接收到
    用作寻径的消息头部即可判断

在这里插入图片描述

虫蚀寻径

请添加图片描述
在这里插入图片描述

  • 优点:每个结点的缓冲区较小;较低的网络传输时延;通道共享性好,利用率高;易于实现选播和广播通信方式。 主要是信道利用率高了,所以快
  • 缺点:当消息的一个片被阻塞时,整个消息都被阻塞。
    在这里插入图片描述

7.7.2 流控制策略

确定性寻径和自适应寻径
  • 确定性寻径: 通信路径完全由源节点地址和目的地址来决定,即寻径路径是预先唯一地确定好了的,而与网络的状况无关
  • 自适应寻径:通信的通路每一次都要根据资源或者网络的情况来选择。 可以避开拥挤的或者有故障的节点,是网络的利用率得到改善

两种确定性寻径算法

  • 在维序概念上,按照特定的顺序线则后继通道
  • 在二维网格中,称为 X-Y寻径,在超立方体网格中称为E立方体寻径
  • 二维网格中,先沿X轴方向前进,再沿Y轴方向前进

在这里插入图片描述
也就是说,从 i =0 到 n-1,判断 S = ( s n − 1 s n − 2 . . . s 1 s 0 ) d = d n − 1 d n − 2 . . . d 1 d 0 S = (s_{n-1}s_{n-2}...s_1s_0) \quad d={d_{n-1}d_{n-2}...d_1d_0} S=(sn1sn2...s1s0)d=dn1dn2...d1d0 第 i 位 是否相等,不相等则 变第 i 位 都得到路径下一个节点 v

在这里插入图片描述

7.7.4 选播和广播寻径算法

1 4种通信模式
  • 单播: 一对一
  • 选拨:一对多
  • 广播:一到全体
  • 会议:多对多

两个参数

  • 通道流量: 传输消息有关的通道数
  • 通信时延:包的最大传输时间

优化的寻径网络应能以最小流量和最小时延实现相关的通信模式

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
第一章 计算机体系结构的基本概念 1.1 引论 1.2 计算机体系结构的概念 1.2.1 计算机系统中的层次概念 1.2.2 计算机体系结构 1.2.3 计算机组成和计算机实现技术 1.3 计算机体系结构的发展 1.3.1 存储程序计算机体系结构及其发展 1.3.2 计算机的分代和分型 1.3.3 应用需求的发展 1.3.4 计算机实现技术的发展 1.3. 5 体系结构的生命周期 1.4 计算机体系结构中并行性的发展 1.4.1并行性概念 1.4.2 提高并行性的技术途径 1.5 定量分析技术基础 1.5.1 计算机性能的评测 1.5.2 测试程序 1.5.3 性能设计和评测的基本原则 1.5.4 CPU的性能 1.6 影响计算机体系结构的成本和价格因素 1.6.1 集成电路的成本 1.6.2 计算机系统的成本和价格 1.7 小结习题一第二章 计算机指令集结构设计 2.1 指令集结构的分类 2.1.1 指令集结构的分类 2.1.2 通用寄存器型指令集结构分类 2.2 寻址技术 2.3 指令集结构的功能设计 2.3.1 CISC计算机指令集结构的功能设计 2.3.2 RISC计算机指令集结构的功能设计 2.3.3 控制指令 2.4 操作数的类型、表示和大小 2.5 指令集格式的设计 2.5.1 寻址方式的表示方法 2.5.2 指令集格式的选择 2.6 编译技术与计算机体系结构设计 2.6.1 现代编译器的结构和相关技术 2.6.2 现代编译技术对计算机体系结构设计的影响 2.6.3 计算机体系结构对当前编译技术的影响 2.7 DLX指令集结构 2.7.1 DLX指令集结构 2.7.2 DLX指令集结构效能分析 2.8 小结习题二第三章 流水线技术 3.1 流水线的基本概念 3.1.1 流水线的基本概念 3.1.2 流水线的分类 3.2 DLX的基本流水线 3.2.1 DLX的一种简单实现 3.2.2 基本的DLX流水线 3.2.3 流水线性能分析 3. 3 流水线中的相关 3.3.1 流水线的结构相关 3.3.2 流水线的数据相关 3.3.3 流水线的控制相关 3.4 流水线计算机实例分析(MIPS R4000) 3.4.1 MIPS R4000整型流水线 3.4.2 MIPS R4000浮点流水线 3.4.3 MIPS R4000流水线的性能分析 3.5 向量处理机 3.5.1 向量处理方式和向量处理机 3.5.2 向量处理机实例分析 3.6 小结习题三第四章 指令级并行 4.1 指令级并行的概念 4.1.1 循环展开调度的基本方法 4.1.2 相关性 4.2 指令的动态调度 4.2.1 动态调度的原理 4.2.2 动态调度算法之一:记分牌 4.2.3 动态调度算法之二:Tomasulo算法 4.3 控制相关的动态解决技术 4.3.1 减少分支延迟:分支预测缓冲技术 4.3.2 进一步减少分支延迟:分支目标缓冲 4.3.3 基于硬件的推断执行 4.4 多指令流出技术 4.4.1 超标量技术 4.4.2 多指令流出的动态调度 4.4.3 超长指令字技术 4.4.4 多流出处理器受到的限制 4.5 小结习题四第五章 存储层次 5.1 存储器的层次结构 5.1.1 从单级存储器到多级存储器 5.1.2 存储层次的性能参数 5.1.3 “Cache—主存”和“主存—辅存”层次 5.1.4 存储层次的四个问题 5.2 Cache基本知识 5.2.1 映象规则 5.2.2 查找方法 5.2.3 替换算法 5.2.4 写策略 5.2.5 Cache的结构 5.2.6 Cache性能分析 5.2.7 改进Cache性能 5.3 降低Cache失效率的方法 5.3.1 增加Cache块大小 5.3.2 提高相联度 5.3.3 Victim Cache 5.3.4 伪相联Cache 5.3.5 硬件预取技术 5.3.6 由编译器控制的预取 5.3.7 编译器优化 5.4 减少Cache失效开销 5.4.1 让读失效优先于写 5.4.2 子块放置技术 5.4.3 请求字处理技术 5.4.4 非阻塞Cache技术 5.4.5 采用两级Cache 5.5 减少命中时间 5.5.1 容量小,结构简单的Cache 5.5.2 虚拟Cache 5.5.3 写操作流水化 5.5.4 Cache优化技术小结 5.6 主存 5.6.1 存储器技术 5.6.2 提高主存性能的存储器组织结构 5.7 虚拟存储器 5.7.1 虚拟存储器基本原理 5.7.2 快表(TLB) 5.7.3 页面大小的选择 5.8 进程保护和虚存实例 5.8.1 进程保护 5.8.2 页式虚存举例:Alpha AXP的存储管理和21064的TLB 5.9 Alpha AXP 21064存储层次 5.10 小结习题五第六章 输入输出系统 6.1 概述 6.2 存储设备 6.2.1 磁盘设备 6.2.2 磁带设备 6.2.3 光盘设备 6.3 总线 6.3.1 总线分类 6.3.2 总线基本工作原理 6.3.3 总线使用 6.3.4 总线标准和实例 6.3.5 设备的连接 6.3.6 CPU与I/O处理的匹配 6.4 通道处理机 6.4.1 通道的作用和功能 6.4.2 通道的工作过程 6.4.3 通道种类 6.4.4 通道中的数据传送过程 6.4.5 通道的流量分析 6.5 I/O与操作系统 6.5.1 I/O和Cache数据一致性 6.5.2 DMA和虚拟存储器 6.6 I/O系统设计 6.7 小结习题六第七章 多处理机 7.1 引言 7.1.1 并行计算机体系结构的分类 7.1.2 通信模型和存储器的结构模型 7.1.3 通信机制的性能 7.1.4 不同通信机制的优点 7.1.5 并行处理面临的挑战 7.1.6 并行程序的计算/通信比率 7.2 多处理机的存储器体系结构 7.2.1 集中式共享存储器体系结构 7.2.2 分布式共享存储器体系结构 7.3 互连网络 7.3.1 互连网络的性能参数 7.3.2 静态连接网络 7.3.3 动态连接网络 7.4 同步与通信 7.4.1 同步机制 7.4.2 大规模机器的同步 7.5 并行化技术 7.5.1 并行化的基本策略 7.5.2 并行语育与编译器 7.6 多处理机实例 7.6.1 Challenge多处理机系统 7.6.2 Origin 20007.

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值