数据结构(九)——外部排序之硬件部分

本博客基于对mooc中的《北京大学-数据结构与算法》及《西北大学-数据结构》的理解进行编写

内存和外存之间的比较

内存

  • 优点:访问速度快
  • 缺点:造价高,存储容量小,断电丢数据

外存

  • 优点:价格低、信息不易丢失、便携带
  • 缺点:速度慢

访问一个字节,访问内存(纳秒)和访问外存(毫秒),量级差别为100万倍,故涉及到外存的排序应尽量减少外存的访问次数

硬件介绍部分

磁盘

磁盘的物理结构:

  • 主轴
  • 盘片
  • 磁道
  • 柱面
  • 读写磁头
  • 活动臂

磁盘磁道的组织(交错法):由于磁盘旋转的速度越来越快,磁盘上的存储也就从原来的顺序存储变成了交错排序的,其中交错因子为3

文件的逻辑结构

  • 文件是记录的汇集,按线性排列起来,顺序结构——可看成是一种线性结构

文件的组织和管理

  • 逻辑文件——连续的字节构成记录,记录构成逻辑文件
  • 物理文件——成块地分布在磁盘中
  • 文件管理器——操作系统或数据库系统的一部分,把逻辑位置映射为物理位置

文件组织

  • 文件逻辑组织的三种形式:1.顺序结构的定长记录。2.顺序结构的变长记录。3.按关键码存取的记录。
  • 常见的物理组织结构:1.顺序结构——顺序文件。2.计算寻址结构——散列文件。3.带索引的结构——带索引的文件(例如:B-树和B+树)
  • 其中有涉及到 IRG (记录间隙)和 IBG (块间间隙)的计算(懂了个大概,是有关于数据的存储,其中 IBG 的存储方式远优于 IRG 的存储方式)

缓冲区和缓冲池

  • 目的:减少磁盘访问的次数
  • 方法:建立缓冲区

策略:由于缓冲区的大小是有限的,故需要对缓冲的数据有所取舍,这里介绍到三个方法

  • 先进先出
  • 最不频繁使用的数据出缓冲区
  • 最近最少使用的数据先出缓冲区(最优)
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值