数据结构与算法(二):数组与链表

参考引用

1. 数组

  • 数组(array)是一种线性数据结构,其将相同类型元素存储在连续的内存空间中。将元素在数组中的位置称为该元素的索引(index)
    在这里插入图片描述

1.1 数组常用操作

1.1.1 初始化数组
  • 根据需求选用数组的两种初始化方式:无初始值、给定初始值
    • 在未指定初始值的情况下,大多数编程语言会将数组元素初始化为 0
    // 存储在栈上
    int arr[5];
    int nums[5] { 1, 3, 2, 5, 4 };
    // 存储在堆上(需要手动释放空间)
    int* arr1 = new int[5];
    int* nums1 = new int[5] { 1, 3, 2, 5, 4 };
    
1.1.2 访问元素
  • 数组元素被存储在连续的内存空间中,给定数组内存地址(即首元素内存地址)和某个元素的索引,可以使用下图所示的公式计算得到该元素的内存地址,从而直接访问此元素
    • 索引的含义本质上是内存地址的偏移量,首个元素的地址偏移量是 0
    • 在数组中访问元素非常高效,可以在 O(1) 时间内随机访问数组中的任意一个元素
    /* 随机访问元素 */
    int randomAccess(int *nums, int size) {
        // 在区间 [0, size) 中随机抽取一个数字
        int randomIndex = rand() % size;
        // 获取并返回随机元素
        int randomNum = nums[randomIndex];
        return randomNum;
    }
    

在这里插入图片描述

1.1.3 插入元素
  • 数组元素在内存中是 “紧挨着的”,它们之间没有空间再存放任何数据。如下图所示,如果想要在数组中间插入一个元素,则需要将该元素之后的所有元素都向后移动一位,之后再把元素赋值给该索引
    /* 在数组的索引 index 处插入元素 num */
    void insert(int *nums, int size, int num, int index) {
        // 把索引 index 以及之后的所有元素向后移动一位
        for (int i = size - 1; i > index; i--) {
            nums[i] = nums[i - 1];
        }
        // 将 num 赋给 index 处元素
        nums[index] = num;
    }
    

在这里插入图片描述

1.1.4 删除元素
  • 若想要删除索引 i 处的元素,则需要把索引 i 之后的元素都向前移动一位
    /* 删除索引 index 处元素 */
    void remove(int *nums, int size, int index) {
        // 把索引 index 之后的所有元素向前移动一位
        for (int i = index; i < size - 1; i++) {
            nums[i] = nums[i + 1];
        }
    }
    

在这里插入图片描述

数组的插入与删除操作有以下缺点,建议使用 vector

  • 时间复杂度高:数组的插入和删除的平均时间复杂度均为 O(n),其中 n 为数组长度
  • 丢失元素:由于数组的长度不可变,因此在插入元素后,超出数组长度范围的元素会丢失
  • 内存浪费:可以初始化一个比较长的数组,只用前面一部分,这样在插入数据时,丢失的末尾元素都是 “无意义” 的,但这样做也会造成部分内存空间的浪费
1.1.5 遍历数组
  • 既可以通过索引遍历数组,也可以直接遍历获取数组中的每个元素
    void traverse(int *nums, int size) {
        int count = 0;
        // 通过索引遍历数组
        for (int i = 0; i < size; i++) {
            count++;
        }
    }
    
1.1.6 查找元素
  • 在数组中查找指定元素需要遍历数组,每轮判断元素值是否匹配,若匹配则输出对应索引。因为数组是线性数据结构,所以上述查找操作被称为 “线性查找”
    /* 在数组中查找指定元素 */
    int find(int *nums, int size, int target) {
        for (int i = 0; i < size; i++) {
            if (nums[i] == target)
                return i;
        }
        return -1;
    }
    

1.2 数组优缺点

  • 优点

    • 空间效率高: 数组为数据分配了连续的内存块,无须额外的结构开销
    • 支持随机访问: 数组允许在 O(1) 时间内访问任何元素
    • 缓存局部性: 当访问数组元素时,计算机不仅会加载它,还会缓存其周围的其他数据,从而借助高速缓存来提升后续操作的执行速度
  • 缺点

    • 插入与删除效率低:当数组中元素较多时,插入与删除操作需要移动大量的元素。
    • 长度不可变: 数组在初始化后长度就固定了,扩容数组需要将所有数据复制到新数组,开销很大
    • 空间浪费: 如果数组分配的大小超过了实际所需,那么多余的空间就被浪费了

1.3 数组典型应用

  • 随机访问、排序和搜索、查找表、机器学习、数据结构实现

2. 链表

内存空间是所有程序的公共资源,在一个复杂系统运行环境下,空闲的内存空间可能散落在各处。存储数组的内存空间必须是连续的,而当数组非常大时,内存可能无法提供如此大的连续空间,此时链表的灵活性优势就被体现

  • 链表(linked list)是一种线性数据结构,其中的每个元素都是一个节点对象,各个节点通过指针相连接,指针记录了下一个节点的内存地址,通过它可以从当前节点访问到下一个节点
    • 链表的设计使得各个节点可以被分散存储在内存各处,它们的内存地址是无须连续的

在这里插入图片描述

  • 链表的组成单位是节点(node)对象。每个节点都包含两项数据:节点的 “值” 和指向下一节点的指针

    • 链表的首个节点被称为 “头节点”,最后一个节点被称为 “尾节点”
    • 尾节点指向的是 “空” nullptr
  • 链表节点 ListNode 除了包含值,还需额外保存一个指针。因此在相同数据量下,链表比数组占用更多的内存空间

    /* 链表节点结构体 */
    struct ListNode {
        int val;         // 节点值
        ListNode *next;  // 指向下一节点的指针
        ListNode(int x) : val(x), next(nullptr) {}  // 构造函数
    };
    

2.1 链表常用操作

2.1.1 初始化链表
  • 建立链表分为两步
    • 第一步是初始化各个节点对象
    • 第二步是构建引用指向关系
      • 初始化完成后,就可以从链表的头节点出发,通过引用指向 next 依次访问所有节点
    /* 初始化链表 1 -> 3 -> 2 -> 5 -> 4 */
    // 初始化各个节点(通常将头节点当作链表的代称)
    ListNode* n0 = new ListNode(1);
    ListNode* n1 = new ListNode(3);
    ListNode* n2 = new ListNode(2);
    ListNode* n3 = new ListNode(5);
    ListNode* n4 = new ListNode(4);
    
    // 构建引用指向
    n0->next = n1;
    n1->next = n2;
    n2->next = n3;
    n3->next = n4;
    

数组整体是一个变量,比如数组 nums 包含元素 nums[0] 和 nums[1] 等,而链表是由多个独立的节点对象组成的

2.1.2 插入节点
  • 假设想在相邻的两个节点 n0 和 n1 之间插入一个新节点 P,只需改变两个节点指针即可,时间复杂度为 O(1)

    相比之下,在数组中插入元素的时间复杂度为 O(n),在大数据量下的效率较低

    /* 在链表的节点 n0 之后插入节点 P */
    void insert(ListNode *n0, ListNode *P) {
        ListNode *n1 = n0->next;
        P->next = n1;
        n0->next = P;
    }
    

在这里插入图片描述

2.1.3 删除节点
  • 只需改变一个节点的指针即可
    • 尽管在删除操作完成后节点 P 仍然指向 n1,但实际上遍历此链表已经无法访问到 P ,这意味着 P 已经不再属于该链表
    /* 删除链表的节点 n0 之后的首个节点 */
    void remove(ListNode *n0) {
        if (n0->next == nullptr)
            return;
        // n0 -> P -> n1
        ListNode *P = n0->next;
        ListNode *n1 = P->next;
        n0->next = n1;
        // 释放内存
        delete P;
    }
    

在这里插入图片描述

2.1.4 访问节点
  • 在链表访问节点的效率较低
    • 如上节所述,可以在 O(1) 时间下访问数组中的任意元素
    • 链表则不然,程序需要从头节点出发,逐个向后遍历,直至找到目标节点。也就是说,访问链表的第 i 个节点需要循环 i - 1 轮,时间复杂度为 O(n)
    /* 访问链表中索引为 index 的节点 */
    ListNode *access(ListNode *head, int index) {
        for (int i = 0; i < index; i++) {
            if (head == nullptr)
                return nullptr;
            head = head->next;
        }
        return head;
    }
    
2.1.5 查找节点
  • 遍历链表,查找链表内值为 target 的节点,输出节点在链表中的索引,此过程也属于线性查找
    /* 在链表中查找值为 target 的首个节点 */
    int find(ListNode *head, int target) {
        int index = 0;
        while (head != nullptr) {
            if (head->val == target)
                return index;
            head = head->next;
            index++;
        }
        return -1;
    }
    

2.2 数组与链表对比

在这里插入图片描述

2.3 常见链表类型

  • 单向链表:即上述介绍的普通链表。单向链表的节点包含值和指向下一节点的引用两项数据
    • 将首个节点称为头节点,将最后一个节点称为尾节点,尾节点指向空
  • 环形链表:如果令单向链表的尾节点指向头节点(即首尾相接),则得到一个环形链表
    • 在环形链表中,任意节点都可以视作头节点
  • 双向链表:与单向链表相比,双向链表记录了两个方向的指针
    • 双向链表的节点定义同时包含指向后继节点(下一个节点)和前驱节点(上一个节点)的指针
    • 相较于单向链表,双向链表更具灵活性,可以朝两个方向遍历链表,但相应地也需要占用更多的内存空间

在这里插入图片描述

2.4 链表典型应用

  • 单向链表通常用于实现栈、队列、哈希表和图等数据结构
  • 双向链表常被用于需要快速查找前一个和下一个元素的场景
    • 高级数据结构
      • 比如在红黑树、B 树中,需要访问节点的父节点,这可以通过在节点中保存一个指向父节点的引用来实现,类似于双向链表
    • 浏览器历史
      • 在网页浏览器中,当用户点击前进或后退按钮时,浏览器需要知道用户访问过的前一个和后一个网页。双向链表的特性使得这种操作变得简单
    • LRU 算法
      • 在缓存淘汰算法(LRU)中,需要快速找到最近最少使用的数据,以及支持快速地添加和删除节点
  • 循环链表常被用于需要周期性操作的场景,比如操作系统的资源调度
    • 时间片轮转调度算法
      • 在操作系统中,时间片轮转调度算法是一种常见的 CPU 调度算法,它需要对一组进程进行循环。每个进程被赋予一个时间片,当时间片用完时,CPU 将切换到下一个进程。这种循环的操作就可以通过循环链表来实现
    • 数据缓冲区
      • 在某些数据缓冲区的实现中,也可能会使用到循环链表。比如在音频、视频播放器中,数据流可能会被分成多个缓冲块并放入一个循环链表,以便实现无缝播放

3. 列表

数组长度不可变导致实用性降低。在实际中,可能事先无法确定需要存储多少数据,这使数组长度的选择变得困难。若长度过小,需要在持续添加数据时频繁扩容数组;若长度过大,则会造成内存空间的浪费

  • 为解决此问题,出现了一种被称为动态数组的数据结构,即长度可变的数组,也常被称为列表 vector (C++)
  • 列表基于数组实现,继承了数组的优点,并可在程序运行过程中动态扩容,可以在列表中自由地添加元素

3.1 列表常用操作

/* 1、初始化列表 */
// 无初始值
vector<int> list1;
// 有初始值
vector<int> list = { 1, 3, 2, 5, 4 };

/* 2、访问元素 */
// 列表本质上是数组,因此可以在 O(1) 时间内访问和更新元素
int num = list[1];  // 访问索引 1 处的元素
/* 更新元素 */
list[1] = 0;  // 将索引 1 处的元素更新为 0

/* 3、插入与删除元素 */
// 在列表尾部添加元素的时间复杂度为 O(1)
// 但插入和删除元素的效率仍与数组相同,时间复杂度为 O(n)
/* 清空列表 */
list.clear();
/* 尾部添加元素 */
list.push_back(1);
list.push_back(3);
list.push_back(2);
list.push_back(5);
list.push_back(4);
/* 中间插入元素 */
list.insert(list.begin() + 3, 6);  // 在索引 3 处插入数字 6
/* 删除元素 */
list.erase(list.begin() + 3);      // 删除索引 3 处的元素

/* 4、通过索引遍历列表 */
int count = 0;
for (int i = 0; i < list.size(); i++) {
    count++;
}
/* 直接遍历列表元素 */
count = 0;
for (int n : list) {
    count++;
}

/* 5、拼接两个列表 */
vector<int> list1 = { 6, 8, 7, 10, 9 };
// 将列表 list1 拼接到 list 之后
list.insert(list.end(), list1.begin(), list1.end());

/* 6、排序列表 */
sort(list.begin(), list.end());  // 排序后,列表元素从小到大排列

3.2 列表实现

/* 列表类简易实现 */
class MyList {
  private:
    int *nums;             // 数组(存储列表元素)
    int numsCapacity = 10; // 列表容量
    int numsSize = 0;      // 列表长度(即当前元素数量)
    int extendRatio = 2;   // 每次列表扩容的倍数

  public:
    /* 构造方法 */
    MyList() {
        nums = new int[numsCapacity];
    }

    /* 析构方法 */
    ~MyList() {
        delete[] nums;
    }

    /* 获取列表长度(即当前元素数量)*/
    int size() {
        return numsSize;
    }

    /* 获取列表容量 */
    int capacity() {
        return numsCapacity;
    }

    /* 访问元素 */
    int get(int index) {
        // 索引如果越界则抛出异常,下同
        if (index < 0 || index >= size())
            throw out_of_range("索引越界");
        return nums[index];
    }

    /* 更新元素 */
    void set(int index, int num) {
        if (index < 0 || index >= size())
            throw out_of_range("索引越界");
        nums[index] = num;
    }

    /* 尾部添加元素 */
    void add(int num) {
        // 元素数量超出容量时,触发扩容机制
        if (size() == capacity())
            extendCapacity();
        nums[size()] = num;
        // 更新元素数量
        numsSize++;
    }

    /* 中间插入元素 */
    void insert(int index, int num) {
        if (index < 0 || index >= size())
            throw out_of_range("索引越界");
        // 元素数量超出容量时,触发扩容机制
        if (size() == capacity())
            extendCapacity();
        // 将索引 index 以及之后的元素都向后移动一位
        for (int j = size() - 1; j >= index; j--) {
            nums[j + 1] = nums[j];
        }
        nums[index] = num;
        // 更新元素数量
        numsSize++;
    }

    /* 删除元素 */
    int remove(int index) {
        if (index < 0 || index >= size())
            throw out_of_range("索引越界");
        int num = nums[index];
        // 索引 i 之后的元素都向前移动一位
        for (int j = index; j < size() - 1; j++) {
            nums[j] = nums[j + 1];
        }
        // 更新元素数量
        numsSize--;
        // 返回被删除元素
        return num;
    }

    /* 列表扩容 */
    void extendCapacity() {
        // 新建一个长度为原数组 extendRatio 倍的新数组
        int newCapacity = capacity() * extendRatio;
        int *tmp = nums;
        nums = new int[newCapacity];
        // 将原数组中的所有元素复制到新数组
        for (int i = 0; i < size(); i++) {
            nums[i] = tmp[i];
        }
        // 释放内存
        delete[] tmp;
        numsCapacity = newCapacity;
    }

    /* 将列表转换为 Vector 用于打印 */
    vector<int> toVector() {
        // 仅转换有效长度范围内的列表元素
        vector<int> vec(size());
        for (int i = 0; i < size(); i++) {
            vec[i] = nums[i];
        }
        return vec;
    }
};
  • 20
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
数据结构是计算机中用来组织和存储数据的方式,而算法则是解决特定问题的步骤和方法。C语言是一种广泛应用于系统开发和高效编程的编程语言,它提供了丰富的数据类型和操作符,使得我们可以灵活地处理各种数据结构和实现各种算法。 在C语言中,我们可以使用数组链表、栈、队列、树等各种数据结构来存储和操作数据。例如,数组是一种连续存储的数据结构,我们可以使用C语言中的数组来存储一组相同类型的数据,通过索引访问和操作数组中的元素。链表则是一种动态存储的数据结构,我们可以通过指针来连接各个节点,实现对链表的增删改查。栈和队列则是一种特殊的数据结构,它们具有先进后出和先进先出的特性,常用于解决需要临时存储和调度数据的问题。树是一种分层存储的数据结构,常用于存储具有层次关系的数据。 而算法则是基于一系列的步骤和逻辑来解决问题的方法。在C语言中,我们可以使用各种语句和控制结构来实现算法。例如,我们可以使用条件语句(如if语句和switch语句)来根据不同情况执行不同的操作,使用循环语句(如for循环和while循环)来重复执行某段代码,使用递归来实现对问题的分解和求解。 数据结构算法的应用广泛存在于各个领域。在软件开发中,我们可以使用数据结构算法来提高程序的效率和性能,优化内存使用和存储空间。在网络和数据库系统中,我们可以使用数据结构算法来处理大量的数据和查询请求,提高系统的响应速度和并发能力。在人工智能和机器学习领域,我们可以使用数据结构算法来构建和训练复杂的模型,实现智能化的决策和分析。 总之,数据结构算法与应用是紧密相连的概念,在C语言中我们可以通过丰富的数据类型和操作符来实现各种数据结构算法,从而解决各种问题并提高程序的效率和性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值