本博客基于对mooc中的《北京大学-数据结构与算法》及《西北大学-数据结构》的理解进行编写
内存和外存之间的比较
内存
- 优点:访问速度快
- 缺点:造价高,存储容量小,断电丢数据
外存
- 优点:价格低、信息不易丢失、便携带
- 缺点:速度慢
访问一个字节,访问内存(纳秒)和访问外存(毫秒),量级差别为100万倍,故涉及到外存的排序应尽量减少外存的访问次数
硬件介绍部分
磁盘
磁盘的物理结构:
- 主轴
- 盘片
- 磁道
- 柱面
- 读写磁头
- 活动臂
磁盘磁道的组织(交错法):由于磁盘旋转的速度越来越快,磁盘上的存储也就从原来的顺序存储变成了交错排序的,其中交错因子为3
文件的逻辑结构
- 文件是记录的汇集,按线性排列起来,顺序结构——可看成是一种线性结构
文件的组织和管理
- 逻辑文件——连续的字节构成记录,记录构成逻辑文件
- 物理文件——成块地分布在磁盘中
- 文件管理器——操作系统或数据库系统的一部分,把逻辑位置映射为物理位置
文件组织
- 文件逻辑组织的三种形式:1.顺序结构的定长记录。2.顺序结构的变长记录。3.按关键码存取的记录。
- 常见的物理组织结构:1.顺序结构——顺序文件。2.计算寻址结构——散列文件。3.带索引的结构——带索引的文件(例如:B-树和B+树)
- 其中有涉及到 IRG (记录间隙)和 IBG (块间间隙)的计算(懂了个大概,是有关于数据的存储,其中 IBG 的存储方式远优于 IRG 的存储方式)
缓冲区和缓冲池
- 目的:减少磁盘访问的次数
- 方法:建立缓冲区
策略:由于缓冲区的大小是有限的,故需要对缓冲的数据有所取舍,这里介绍到三个方法
- 先进先出
- 最不频繁使用的数据出缓冲区
- 最近最少使用的数据先出缓冲区(最优)