不同存储结构的文件磁盘io操作次数_基于磁盘IO角度来看二叉树、B-tree树、B+树...

最新推荐文章于 2023-01-19 13:55:14 发布

weixin_39616686

最新推荐文章于 2023-01-19 13:55:14 发布

阅读量1.7k

点赞数 4

文章标签：不同存储结构的文件磁盘io操作次数

概述

前面已经介绍了B-TREE的相关内容，所以这里对其架构就不多做介绍了，主要是从磁盘IO的角度来看，看一下为什么要用B树。

相关概念

B树这种数据结构常常用于实现数据库索引，因为它的查找效率比较高。

1、磁盘IO与预读

磁盘读取依靠的是机械运动，分为寻道时间、旋转延迟、传输时间三个部分，这三个部分耗时相加就是一次磁盘IO的时间，大概9ms左右。这个成本是访问内存的十万倍左右；

正是由于磁盘IO是非常昂贵的操作，所以计算机操作系统对此做了优化：预读；每一次IO时，不仅仅把当前磁盘地址的数据加载到内存，同时也把相邻数据也加载到内存缓冲区中。因为局部预读原理说明：当访问一个地址数据的时候，与其相邻的数据很快也会被访问到。每次磁盘IO读取的数据我们称之为一页(page)。一页的大小与操作系统有关，一般为4k或者8k。这也就意味着读取一页内数据的时候，实际上发生了一次磁盘IO。

2、B-Tree与二叉查找树的对比

二叉查找树查询的时间复杂度是O(logN)，查找速度最快和比较次数最少，既然性能已经如此优秀，但为什么实现索引是使用B-Tree而不是二叉查找树，关键因素是磁盘IO的次数。

数据库索引是存储在磁盘上，当表中的数据量比较大时，索引的大小也跟着增长，达到几个G甚至更多。当我们利用索引进行查询的时候，不可能把索引全部加载到内存中，只能逐一加载每个磁盘页，这里的磁盘页就对应索引树的节点。

下面先讲讲二叉树

一、二叉树

先来看二叉树查找时磁盘IO的次数：假设定义一个树高为4的二叉树，查找值为10：

最低0.47元/天解锁文章

weixin_39616686

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
不同存储结构的文件磁盘io操作次数_基于磁盘IO角度来看二叉树、B-tree树、B+树...

概述前面已经介绍了B-TREE的相关内容，所以这里对其架构就不多做介绍了，主要是从磁盘IO的角度来看，看一下为什么要用B树。相关概念B树这种数据结构常常用于实现数据库索引，因为它的查找效率比较高。1、磁盘IO与预读磁盘读取依靠的是机械运动，分为寻道时间、旋转延迟、传输时间三个部分，这三个部分耗时相加就是一次磁盘IO的时间，大概9ms左右。这个成本是访问内存的十万倍左右；正是由于磁盘IO是非常昂贵的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。