基础数据结构（python）_数据结构基础(python版)-CSDN博客

本文链接：https://blog.csdn.net/m0_68409964/article/details/136401946

数据结构分类

数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。

常用的数据结构有：数组，栈，链表，队列，树，图，堆，散列表等，如图所示：

在这里插入图片描述

每一种数据结构都有着独特的数据存储方式，下面为大家介绍它们的结构和优缺点。

数组

数组是可以在内存中连续存储多个元素的结构，在内存中的分配也是连续的，数组中的元素通过数组下标进行访问，数组下标从0开始。例如下面这段代码就是将数组的第一个元素赋值为 1。

int[] data = new int[100]；data[0] = 1;

优点：

1. 按照索引查询元素速度快
2. 按照索引遍历数组方便

缺点：

1. 数组的大小固定后就无法扩容了
2. 数组只能存储一种类型的数据
3. 添加，删除的操作慢，因为要移动其他的元素。

适用场景：

频繁查询，对存储空间要求不大，很少增加和删除的情况。

链表

链表是物理存储单元上非连续的、非顺序的存储结构，数据元素的逻辑顺序是通过链表的指针地址实现，每个元素包含两个结点，一个是存储元素的数据域 (内存空间)，另一个是指向下一个结地址的指针域。根据指针的指向，链表能形成不同的结构，例如单链表，双向链表，循环链表等。

在这里插入图片描述

链表的优点：

链表是很常用的一种数据结构，不需要初始化容量，可以任意加减元素；

添加或者删除元素时只需要改变前后两个元素结点的指针域指向地址即可，所以添加，删除很快；

缺点：

因为含有大量的指针域，占用空间较大；

查找元素需要遍历链表来查找，非常耗时。

适用场景：

数据量较小，需要频繁增加，删除操作的场景

栈

栈是一种特殊的线性表，仅能在线性表的一端操作，栈顶允许操作，栈底不允许操作。栈的特点是：先进后出，或者说是后进先出，从栈顶放入元素的操作叫入栈，取出元素叫出栈。

在这里插入图片描述

栈的结构就像一个集装箱，越先放进去的东西越晚才能拿出来，所以，栈常应用于实现递归功能方面的场景，例如斐波那契数列。

栈的列表实现

class Stack(object):
	def __init__(self):
        # 创建空列表实现栈
        self.__list = []

    def is_empty(self):
        # 判断是否为空
        return self.__list == []

    def push(self,item):
        # 压栈，添加元素
        self.__list.append(item)

    def pop(self):
        # 弹栈，弹出最后压入栈的元素
        if self.is_empty():
            return
        else:
            return self.__list.pop()
        
    def top(self):
        # 取最后压入栈的元素
        if self.is_empty():
            return
        else:
            return self.__list[-1]

栈的链表实现

class Node(object):

"""节点的实现"""
	def __init__(self,elem):
        self.elem = elem
        self.next = None
        
class Stack(object):
    
    def __init__(self):
        """ 初始化，链表头head"""
        self.__head = None

    def is_empty(self):
        """ 初始化，链表头head"""
        return self.__head is None
    
    def push(self,item):
        """ 压栈"""
        node = Node(item)
        node.next = self.__head
        self.__head = node
        
    def pop(self):
        """ 弹栈"""
        if self.is_empty():
            return
        else:
            p = self.__head
            self.__head = p.next
            return p.elem

队列

队列与栈一样，也是一种线性表，不同的是，队列可以在一端添加元素，在另一端取出元素，也就是：先进先出。从一端放入元素的操作称为入队，取出元素为出队，示例图如下：

在这里插入图片描述

使用场景：因为队列先进先出的特点，在多线程阻塞队列管理中非常适用。

树

树是一种数据结构，它是由n（n>=1）个有限节点组成一个具有层次关系的集合。把它叫做 “树” 是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。它具有以下的特点：

每个节点有零个或多个子节点；
没有父节点的节点称为根节点；
每一个非根节点有且只有一个父节点；
除了根节点外，每个子节点可以分为多个不相交的子树；

在日常的应用中，我们讨论和用的更多的是树的其中一种结构，就是二叉树。

在这里插入图片描述

二叉树是树的特殊一种，具有如下特点：

每个结点最多有两颗子树，结点的度最大为2。
左子树和右子树是有顺序的，次序不能颠倒。
即使某结点只有一个子树，也要区分左右子树。

二叉树是一种比较有用的折中方案，它添加，删除元素都很快，并且在查找方面也有很多的算法优化，所以，二叉树既有链表的好处，也有数组的好处，是两者的优化方案，在处理大批量的动态数据方面非常有用。

扩展：

二叉树有很多扩展的数据结构，包括平衡二叉树、红黑树、B+树等，这些数据结构二叉树的基础上衍生了很多的功能，在实际应用中广泛用到，例如mysql的数据库索引结构用的就是B+树，还有HashMap的底层源码中用到了红黑树。这些二叉树的功能强大，但算法上比较复杂，想学习的话还是需要花时间去深入的。

二叉树的实现

参考网址：https://www.cnblogs.com/zivli/p/11373288.html

遍历顺序参考：https://blog.csdn.net/qq_50931436/article/details/121407707

"""
实现一个二叉树结果，并进行遍历
    E
   / \
  A   G
   \   \
    C   F
   / \
  B   D
"""
from collections import deque

# 构造每个数据节点
class BinaryTree(object):
    def __init__(self, data):
        self.data = data
        self.child_l = None
        self.child_r = None
        
# 创建
a = BinaryTree("A")
b = BinaryTree("B")
c = BinaryTree("C")
d = BinaryTree("D")
e = BinaryTree("E")
f = BinaryTree("F")
g = BinaryTree("G")

# 构造节点关系
e.child_l = a
e.child_r = g
a.child_r = c
c.child_l = b
c.child_r = d
g.child_r = f

# 设置根
root = e

def pre_order(tree):
    """
前序遍历:root -> child_l -> child_r
按照根左右的顺序沿一定路径经过路径上所有的结点。在二叉树中，先根后左再右。巧记：根左右。
:param tree: the root of tree
:return:
	"""
    if tree:
        print(tree.data, end=',')
        # print("")
        pre_order(tree.child_l)
        pre_order(tree.child_r)

def in_order(tree):
    """
中序遍历：child_l -> root -> child_r
按照左根右的顺序沿一定路径经过路径上所有的结点，中序遍历首先遍历左子树，然后访问根结点，最后遍历右子树，巧记：左根右。
:param tree:
:return:
	"""
    if tree:
        in_order(tree.child_l)
        print(tree.data, end=',')
        in_order(tree.child_r)

def post_order(tree):
    """
后序遍历：child_l -> child_r -> root
按照左右根的顺序沿一定路径经过路径上所有的结点，后序遍历首先遍历左子树，然后访问右子树，最后遍历根结点，巧记：左右根。
:param tree:
:return:
	"""
    if tree:
        post_order(tree.child_l)
        post_order(tree.child_r)
        print(tree.data, end=',')

def level_order(tree):
    """
层次遍历：E -> AG -> CF -> BD
要进行层次遍历，需要建立一个循环队列。先将二叉树头结点入队列，再将头结点的左、右节点入队列，此时头节点就可以出队列遍历，然后重复上面的操作直到队头和队尾为空，这就是层次遍历。
使用队列实现
:param tree:
:return:
	"""
    queue = deque()
    queue.append(tree) # 先把根添加到队列
	while len(queue): # 队列不为空
        node = queue.popleft()
        print(node.data, end=',')
        if node.child_l:
            queue.append(node.child_l)
        if node.child_r:
            queue.append(node.child_r)

pre_order(root)
print('')
in_order(root)
print('')
post_order(root)
print('')
level_order(root)

B+树参考博客：https://www.cnblogs.com/nullzx/p/8729425.html

散列表

散列表，也叫哈希表，是根据关键码和值 (key和value) 直接进行访问的数据结构，通过key和value来映射到集合中的一个位置，这样就可以很快找到集合中的对应元素。

记录的存储位置=f(key)

这里的对应关系 f 成为散列函数，又称为哈希 (hash函数)，而散列表就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字，然后就将该数字对数组长度进行取余，取余结果就当作数组的下标，将value存储在以该数字为下标的数组空间里，这种存储空间可以充分利用数组的查找优势来查找元素，所以查找的速度很快。

哈希表在应用中也是比较常见的，就如Java中有些集合类就是借鉴了哈希原理构造的，例如HashMap，HashTable等，利用hash表的优势，对于集合的查找元素时非常方便的，然而，因为哈希表是基于数组衍生的数据结构，在添加删除元素方面是比较慢的，所以很多时候需要用到一种数组链表来做，也就是拉链法。拉链法是数组结合链表的一种结构，较早前的hashMap底层的存储就是采用这种结构，直到jdk1.8之后才换成了数组加红黑树的结构，其示例图如下：

在这里插入图片描述