数据结构最完整汇总(简洁全面、Java代码示例)

1 数据结构简介

  1. 数据结构是为实现对计算机数据有效使用的各种数据组织形式,服务于各类计算机操作;
  2. 不同的数据结构具有各自对应的适用场景,旨在降低各种算法计算的时间与空间复杂度,达到最佳的任务执行效率;

分类

  • 数据结构可分为线性数据结构与非线性数据结构;
  • 线性数据结构:数组、链表、栈、队列;
  • 非线性数据结构:树、堆、散列表、图;
    在这里插入图片描述

2 线性

2.1 数组

  • 数组是将相同类型的元素存储于连续内存空间的数据结构,其长度不可变;
  • 构建数组需要在初始化时给定长度,可对数组每个索引元素赋值;
// 初始化一个长度为 5 的数组 array
int[] array = new int[5];// 其中元素自动拥有默认值。如果是i整数类型,默认为0;如果是浮点类型,默认0.0;如果是字符类型,默认‘\u0000’;如果是布尔类型,默认false;如果是引用类型,默认null。
// 元素赋值
array[0] = 2;
array[1] = 3;
array[2] = 1;
array[3] = 0;
array[4] = 2;
  • 也可以使用直接赋值的方式,自动推算长度;
int[] array = {2, 3, 1, 0, 2};

可变数组:

  • 可变数组是经常使用的数据结构,其基于数组和扩容机制实现,相比普通数组更加灵活。常用操作有:访问元素、添加元素、删除元素。
// 初始化可变数组
List<Integer> array = new ArrayList<>();

// 向尾部添加元素
array.add(2);
array.add(3);
array.add(1);
array.add(0);
array.add(2);

2.2 链表

  • 链表以结点为单位,每个结点都是一个独立对象,在内存空间的存储是非连续的;
  • 链表的结点包含两个成员变量:值 val、后继节点引用 next;

结点实现

class ListNode {
    int val;       // 节点值
    ListNode next; // 后继节点引用
    ListNode(int x) { val = x; }
}

链表实现

建立链表需要实例化每个结点,并构建各结点的引用指向。

// 实例化节点
ListNode n1 = new ListNode(4); // 节点 head
ListNode n2 = new ListNode(5);
ListNode n3 = new ListNode(1);

// 构建引用指向
n1.next = n2;
n2.next = n3;

在这里插入图片描述

2.3 栈

  • 栈是一种具有 「先入后出」 特点的抽象数据结构,可使用数组或链表实现;
Deque<Integer> stack = new LinkedList<>();
  • 入栈 push()、出栈 pop(),展示了栈的先入后出特性;
stack.push(1); // 元素 1 入栈
stack.push(2); // 元素 2 入栈
stack.pop();   // 出栈 -> 元素 2
stack.pop();   // 出栈 -> 元素 1

2.4 队列

  • 队列是一种具有 「先入先出」 特点的抽象数据结构,可使用链表实现;
Deque<Integer> queue = new LinkedList<>();
  • 入队 offer()、出队 poll(),展示了队列的先入先出特性;
queue.offer(1); // 元素 1 入队
queue.offer(2); // 元素 2 入队
queue.poll();   // 出队 -> 元素 1
queue.poll();   // 出队 -> 元素 2

3 非线性

3.1 树

  • 树是一种非线性数据结构,根据子节点数量可分为二叉树和多叉树,最顶层的节点称为根节点 root;
  • 以二叉树为例,每个节点包含三个成员变量:值 val、左子节点 left、右子节点 right ;

结点实现

class TreeNode {
    int val;        // 节点值
    TreeNode left;  // 左子节点
    TreeNode right; // 右子节点
    TreeNode(int x) { val = x; }
}

二叉树实现

建立二叉树需要实例化每个节点,并构建各节点的引用指向。

// 初始化节点
TreeNode n1 = new TreeNode(3); // 根节点 root
TreeNode n2 = new TreeNode(4);
TreeNode n3 = new TreeNode(5);
TreeNode n4 = new TreeNode(1);
TreeNode n5 = new TreeNode(2);

// 构建引用指向
n1.left = n2;
n1.right = n3;
n2.left = n4;
n2.right = n5;

在这里插入图片描述

3.2 堆

  • 堆是一种基于完全二叉树的数据结构,可使用数组实现;
  • 以堆为原理的排序算法称为堆排序,基于堆实现的数据结构为优先队列;
  • 堆分为大顶堆和小顶堆,大(小)顶堆:每个结点大于(小于)等于它的两个子结点;

完全二叉树: 设二叉树深度为 k ,若二叉树除第 k 层外的其它各层(第 1 至 k−1 层)的节点达到最大个数,且处于第 k 层的节点都连续集中在最左边。

  • 下图为包含 1, 4, 2, 6, 8 元素的小顶堆,将堆(完全二叉树)中的结点按层编号,即可映射到右边的数组存储形式;

在这里插入图片描述

  • 通过使用优先队列的入队 offer()和出队 poll(),即可完成堆排序;
// 初始化小顶堆
PriorityQueue<Integer> heap = new PriorityQueue<>();

// 元素入堆
heap.offer(1);
heap.offer(4);
heap.offer(2);
heap.offer(6);
heap.offer(8);

// 元素出堆(从小到大)
heap.poll(); // -> 1
heap.poll(); // -> 2
heap.poll(); // -> 4
heap.poll(); // -> 6
heap.poll(); // -> 8

在Java库中PriorityQueue默认是小顶堆,而在使用中根据实际情况可能建立大顶堆,因此要通过comparator接口重写compare方法。可参考https://blog.csdn.net/sc179/article/details/109893210

3.3 散列表

  • 散列表是一种非线性数据结构,通过利用 Hash 函数将指定的「键 key」映射至对应的「值 value」,以实现高效的元素查找。

案例演示

小力、小特、小扣的学号分别为 10001, 10002, 10003 ,现需求从「姓名」查找「学号」。

可通过建立姓名为 key ,学号为 value 的散列表实现此需求,代码如下:

// 初始化散列表
Map<String, Integer> dic = new HashMap<>();

// 添加 key -> value 键值对
dic.put("小力", 10001);
dic.put("小特", 10002);
dic.put("小扣", 10003);

// 从姓名查找学号
dic.get("小力"); // -> 10001
dic.get("小特"); // -> 10002
dic.get("小扣"); // -> 10003

在这里插入图片描述
自行设计 Hash 函数

假设需求:从「学号」查找「姓名」。

将三人的姓名存储至以下数组中,则各姓名在数组中的索引分别为 0, 1, 2 。

String[] names = { "小力", "小特", "小扣" };

此时,我们构造一个简单的 Hash 函数,如下所示:

  • hash(key)=(key−1)%10000
int hash(int id) {
    int index = (id - 1) % 10000;
    return index;
}

则我们构建了以学号为 key 、姓名对应的数组索引为 value 的散列表。利用此 Hash 函数,则可在 O(1) 时间复杂度下通过学号查找到对应姓名,即:

names[hash(10001)] // 小力
names[hash(10002)] // 小特
names[hash(10003)] // 小扣

在这里插入图片描述

以上设计只适用于此示例,实际的 Hash 函数需保证低碰撞率、 高鲁棒性等,以适用于各类数据和场景。

3.4 图

  • 图是一种非线性数据结构,由顶点vertex和边 edge组成,每条边连接一对顶点;
  • 根据边的方向有无,图可分为有向图和无向图;

本文以无向图为例开展介绍。

如下图所示,此无向图的顶点和边集合分别为:

  1. 顶点集合: vertices = {1, 2, 3, 4, 5}
  2. 边集合: edges = {(1, 2), (1, 3), (1, 4), (1, 5), (2, 4), (3, 5), (4, 5)}
    在这里插入图片描述

图的两种表示方法

1 邻接矩阵

使用数组 vertices 存储顶点,邻接矩阵 edges 存储边; edges[i][j]代表顶点 i 和顶点 j 之间是否有边。

例如:

int[] vertices = {0, 1, 2, 3, 4};
int[][] edges = {{0, 1, 1, 1, 1},
                 {1, 0, 0, 1, 0},
                 {1, 0, 0, 0, 1},
                 {1, 1, 0, 0, 1},
                 {1, 0, 1, 1, 0}};

2 邻接表

使用数组 vertices 存储顶点,邻接表 edges 存储边。edges 为一个二维容器,第一维 i 代表顶点索引,第二维 edges[i]存储此顶点对应的边集合;例如 edges[0] = [1, 2, 3, 4]代表 vertices[0] 的边集合为 [1, 2, 3, 4]。

int[] vertices = {0, 1, 2, 3, 4};
List<List<Integer>> edges = new ArrayList<>();

List<Integer> edge_1 = new ArrayList<>(Arrays.asList(1, 2, 3, 4));
List<Integer> edge_2 = new ArrayList<>(Arrays.asList(0, 3));
List<Integer> edge_3 = new ArrayList<>(Arrays.asList(0, 4));
List<Integer> edge_4 = new ArrayList<>(Arrays.asList(0, 1, 4));
List<Integer> edge_5 = new ArrayList<>(Arrays.asList(0, 2, 3));
edges.add(edge_1);
edges.add(edge_2);
edges.add(edge_3);
edges.add(edge_4);
edges.add(edge_5);

邻接矩阵 VS 邻接表

  1. 邻接矩阵的大小只与节点数量有关,即 N^2,其中 N 为节点数量。因此,当边数量明显少于节点数量时,使用邻接矩阵存储图会造成较大的内存浪费;
  2. 邻接表适合存储稀疏图(顶点较多、边较少); 邻接矩阵适合存储稠密图(顶点较少、边较多);
  • 4
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hellosc01

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值