数据结构c语言版第一章知识点关系图,读书笔记数据结构（c语言版）

最新推荐文章于 2022-05-18 14:32:21 发布

weixin_39678103

最新推荐文章于 2022-05-18 14:32:21 发布

阅读量141

点赞数

文章标签：数据结构c语言版第一章知识点关系图

读书笔记数据结构(c语言版)

之前应该扫过的，如今再看一遍，顺便做些笔记

第一章

凡事说定义：

数据结构：是相互之间存在一种或多种特定关系的数据元素的集合。

根据元素之间关系，主要分，集合；线性结构；树型结构；图状/网状

第三章

栈经常能解决的问题：

括号匹配检测问题：碰到任何左括号，压入栈，碰到有括号，弹出栈，弹出的和碰到的有括号是否匹配；

迷宫求解：这个，之前搞过，能理解，压情况在栈中。

表达式求值：就是加减乘除有优先级，

第六章

霍夫曼树！哈夫曼树！

构造过程已经了解：点击打开链接

性质：哈夫曼编码、这样就可以起到压缩作用。

在数据通信中，需要将传送的文字转换成二进制的字符串，用0，1码的不同排列来表示字符。例如，需传送的报文为“AFTER DATA EAR ARE ART AREA”，这里用到的字符集为“A，E，R，T，F，D”，各字母出现的次数为{8，4，5，3，1，1}。现要求为这些字母设计编码。要区别6个字母，最简单的二进制编码方式是等长编码，固定采用3位二进制，可分别用000、001、010、011、100、101对“A，E，R，T，F，D”进行编码发送，当对方接收报文时再按照三位一分进行译码。显然编码的长度取决报文中不同字符的个数。若报文中可能出现26个不同字符，则固定编码长度为5。然而，传送报文时总是希望总长度尽可能短。在实际应用中，各个字符的出现频度或使用次数是不相同的，如A、B、C的使用频率远远高于X、Y、Z，自然会想到设计编码时，让使用频率高的用短码，使用频率低的用长码，以优化整个报文编码。

第七章图

深度优先搜索(DFS)

广度优先搜索(BFS)

第九章查找

B-树(B树，不是B-树，作为查找还是比B+好的)，是一种平衡的多路查找树，在文件系统中很有用

这个图就知道了，大概是怎么回事，可是为啥要这样呢，二叉树不行么

B+树是文件系统所需的一种B-树的变形树

用B树作为文件存储的原因(对应磁盘读取，点击打开链接)：

磁盘读取数据是以盘块(block)为基本单位的。位于同一盘块中的所有数据都能被一次性全部读取出来。而磁盘IO代价主要花费在查找时间Ts上。因此我们应该尽量将相关信息存放在同一盘块，同一磁道中。或者至少放在同一柱面或相邻柱面上，以求在读/写信息时尽量减少磁头来回移动的次数，避免过多的查找时间Ts。

所以，在大规模数据存储方面，大量数据存储在外存磁盘中，而在外存磁盘中读取/写入块(block)中某数据时，首先需要定位到磁盘中的某块，如何有效地查找磁盘中的数据，需要一种合理高效的外存数据结构。这种结构可以使得在查找过程中，IO次数尽量的少。

所以，在大规模数据存储方面，大量数据存储在外存磁盘中，而在外存磁盘中读取/写入块(block)中某数据时，首先需要定位到磁盘中的某块，如何有效地查找磁盘中的数据，需要一种合理高效的外存数据结构。这种结构可以使得在查找过程中，IO次数尽量的少。下面，咱们来模拟下查找文件29的过程：

(1) 根据根结点指针找到文件目录的根磁盘块1，将其中的信息导入内存。【磁盘IO操作1次】

(2) 此时内存中有两个文件名17，35和三个存储其他磁盘页面地址的数据。根据算法我们发现17<29<35，因此我们找到指针p2。

(3) 根据p2指针，我们定位到磁盘块3，并将其中的信息导入内存。【磁盘IO操作2次】

(4) 此时内存中有两个文件名26，30和三个存储其他磁盘页面地址的数据。根据算法我们发现26<29<30，因此我们找到指针p2。

(5) 根据p2指针，我们定位到磁盘块8，并将其中的信息导入内存。【磁盘IO操作3次】

(6) 此时内存中有两个文件名28，29。根据算法我们查找到文件29，并定位了该文件内存的磁盘地址。

分析上面的过程，发现需要3次磁盘IO操作和3次内存查找操作。关于内存中的文件名查找，由于是一个有序表结构，可以利用折半查找提高效率。至于3次磁盘IO操作时影响整个B树查找效率的决定因素。

画重点，不用二叉树的原因！！！！！！！！

当然，如果我们使用平衡二叉树的磁盘存储结构来进行查找，磁盘IO操作最少4次，最多5次。而且文件越多，B树比平衡二叉树所用的磁盘IO操作次数将越少，效率也越高。

而B+树：

一棵m阶的B+树和m阶的B树的差异在于：

1.有n棵子树的结点中含有n个关键字； (而B 树是n棵子树有n-1个关键字)

2.所有的叶子结点中包含了全部关键字的信息，及指向含有这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大的顺序链接。 (而B 树的叶子节点并没有包括全部需要查找的信息)

3.所有的非终端结点可以看成是索引部分，结点中仅含有其子树根结点中最大(或最小)关键字。 (而B 树的非终节点也包含需要查找的有效信息)

1) B+-tree的磁盘读写代价更低

B+-tree的内部结点并没有指向关键字具体信息的指针。因此其内部结点相对B 树更小。如果把所有同一内部结点的关键字存放在同一盘块中，那么盘块所能容纳的关键字数量也越多。一次性读入内存中的需要查找的关键字也就越多。相对来说IO读写次数也就降低了。

举个例子，假设磁盘中的一个盘块容纳16bytes，而一个关键字2bytes，一个关键字具体信息指针2bytes。一棵9阶B-tree(一个结点最多8个关键字)的内部结点需要2个盘快。而B+ 树内部结点只需要1个盘快。当需要把内部结点读入内存中的时候，B 树就比B+ 树多一次盘块查找时间(在磁盘中就是盘片旋转的时间)。

2) B+-tree的查询效率更加稳定

由于非终结点并不是最终指向文件内容的结点，而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同，导致每一个数据的查询效率相当。

当然还有B*树。。B*树：一棵丰满的B+树。：

看看吧就，貌似是分配新节点的概率比B+树低。。

读书笔记数据结构(c语言版)相关教程

weixin_39678103

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构c语言版第一章知识点关系图,读书笔记数据结构（c语言版）

读书笔记数据结构(c语言版)读书笔记数据结构(c语言版)之前应该扫过的，如今再看一遍，顺便做些笔记第一章凡事说定义：数据结构：是相互之间存在一种或多种特定关系的数据元素的集合。根据元素之间关系，主要分，集合；线性结构；树型结构；图状/网状第三章栈经常能解决的问题：括号匹配检测问题：碰到任何左括号，压入栈，碰到有括号，弹出栈，弹出的和碰到的有括号是否匹配；迷宫求解：这个，之前搞过，能理解，压情况...
复制链接

扫一扫