数据结构基础

零点冰.

已于 2023-08-23 20:21:31 修改

阅读量269

点赞数

分类专栏：数据结构和算法文章标签：数据结构

于 2023-08-06 23:56:58 首次发布

本文链接：https://blog.csdn.net/weixin_37672801/article/details/131752034

版权

数据结构和算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文概述了计算机科学中的关键数据结构，如线性表（数组、链表、栈和队列）、散列表（哈希表）、二叉树（包括红黑树、平衡二叉树、B树和B+树）以及图的结构（有向图、无向图、带权图），还介绍了深度优先搜索和广度优先搜索的算法。

摘要由CSDN通过智能技术生成

1、线性表

1.1、数组

概念：有限个相同类型的变量所组成的有序集合。下标从零开始。
存储原理：用一组连续的内存空间来存储一组具有相同类型的数据。
元素访问：O(1)，根据下标访问数据。首地址(假设为1000)，数组类型(假设为int：4字节)，那么第3个元素的地址为 1000 + (3-1)*4 = 1008。
操作：读取元素、更新元素、插入元素、删除元素。
时间复杂度：读取和更新->O(1)，插入和删除->O(n)。
优缺点：根据下标的随机访问很高效；但插入和删除操作，可能会导致大量元素被迫移动，效率较低。扩容时，需要重新申请内存进行存储，原空间就没用了。

1.2、链表

概念：非连续的、非顺序的数据结构，由若干个节点组成。链表由一系列结点组成，每个结点包含一个存储元素的数据域和一个存储下一个结点地址的指针域。常见链表有单链表、双向链表、循环链表。
存储原理：结点在内存中随机存储，通过每个结点中的指针域，将零碎的链表空间，进行关联。
操作：查找结点、更新结点、插入结点、删除结点。
时间复杂度：查找结点->O(n)，插入/更新/删除结点->O(1)。
优缺点：插入、删除、更新效率高，不需要连续的内存空间。但查询效率较低。

1.3、栈

概念：线性数据结构，栈中元素只能先入后出。最早进入的元素的位置叫做栈底，最后进入的元素的位置叫做栈顶。
存储原理：数组和链表都可以作为栈的底层数据结构。数组实现的栈也称为顺序栈或静态栈，链表实现的栈也称为链式栈或动态栈。
操作：入栈(push)、出栈(pop)。
时间复杂度：入栈/出栈->O(1)。

1.4、队列

概念：线性数据结构，队列中元素只能先入先出。队列的出口端叫做队头，队列的入口端叫做队尾。
存储原理：数组和链表都可以实现队列。用数组实现的队列也叫做顺序队列，用链表实现的队列也叫做链式队列。
操作：入队(enquene)、出队(dequeue)。
时间复杂度：入队/出队->O(1)。

2、散列表

概念：也叫做哈希表，提供了key-value的映射关系。可以通过key，高效查询出其对应的value。
存储原理：散列表本质上是一个数组。通过hash函数把key转换成数组下标，作用是把任意长度的输入通过散列算法转换成固定类型、固定长度的散列值。数组固定时，可快速检索；数组变化时，需要对全部数据重新hash。(可通过一致性Hash算法进行改进)
优缺点：读写快，但Hash表中的元素是无序的，当遇到扩容时，需要重新计算所有元素的Hash值。
应用：HashMap、Redis字典、布隆过滤器、位图。
时间复杂度

写操作：O(1) + O(m) = O(m) m为单链元素个数

读操作：O(1) + O(m) m为单链元素个数

Hash冲突写单链表：O(m)

Hash扩容：O(n) n是数组元素个数 rehash

Hash冲突读单链表：O(m) m为单链元素个数

操作
- 写操作(put)

向散列表插入新的键值对。

①：通过hash函数，将key转换成数组下标；

②：将键值对插入对应的数组下标所在位置。

Hash冲突(碰撞)

不同的key通过hash函数，得到相同的数组下标，该场景就被称为Hash冲突。Hash冲突可通过如下两种方式解决：

①：开放寻址法：当一个key通过Hash函数获得的对应的数组下标已经被占用时，就寻找下一个空档位置进行存储；

②：链表法：当发生Hash冲突时，将Hash冲突的多个键值对，使用链表进行存储。

读操作(get)

通过给定的key，在散列表中查询对应的value。

①：通过Hash函数，将key转换成数组下标；

②：找到数组下标对应的Entry，如果key不正确，说明有Hash冲突，通过链表头遍历该单链表，根据key值找到对应value。

Hash扩容

Capacity：HashMap的当前长度。

LoadFactor：HashMap的负载因子（阈值），默认值为0.75f。

当HashMap.Size >= Capacity×LoadFactor时，需要进行扩容。

①：数组扩容，创建一个新的Entry空数组，长度是原数组的2倍。

②：对原数组的所有元素进行再Hash，把所有元素放入新的数组中。

3、树

树是N(N>=0)个节点的有限集合，树的顶部有且仅有一个节点，称为根。
当N = 0时，称为空树。
当N != 0时，其余节点又可分为m个互不相交的有限集合(子树)。
常见的树有二叉树、多路树、堆等。

3.1、二叉树

二叉树：树的每个节点最多有两个孩子节点，分别称为左孩子和右孩子，且左孩子必然小于右孩子。
满二叉树：树的所有非叶子节点都有左右孩子，且所有叶子节点在同一层级。
完全二叉树：类比满二叉树，编号位置与满二叉树一样，且编号连续的树，称为完全二叉树。
二叉查找树：左孩子小于父节点，右孩子大于父节点。查询和插入的时间复杂度为O(logn)。

3.1.1、存储原理

逻辑存储结构，可使用数组和链表进行存储。
链表存储(常见二叉树)：每个Node包含：节点数据、指向左孩子的指针、指向右孩子的指针。
数组存储(完全二叉树)：根节点为下标为0的数组位置，然后从上往下，从左往右依次标记下标位置。若父节点下标 = n，左孩子节点下标 = 2 * n + 1，右孩子节点下标 = 2 * (n+1)。