算法题——合并 k 个升序的链表

金池尽干

于 2024-10-12 09:12:13 发布

阅读量448

点赞数 16

文章标签：算法链表数据结构

本文链接：https://blog.csdn.net/m0_71974552/article/details/142790550

版权

题目描述：

合并 k 个升序的链表并将结果作为一个升序的链表返回其头节点。

数据范围：节点总数 0≤n≤50000≤n≤5000，每个节点的val满足 ∣val∣<=1000∣val∣<=1000

要求：时间复杂度 O(nlogn)

一、常见解法

（一）暴力排序法

暴力排序法的思路非常直接。首先，将链表数组中的所有链表进行遍历，把它们头尾相接组成一个长链表。这个过程可以通过遍历链表数组，对于每个链表，依次将其节点添加到新的长链表中。然后，对这个长链表进行排序。这种方法虽然简单易懂，但是时间复杂度比较高。因为在组成长链表的过程中，需要遍历整个链表数组，时间复杂度为 O(k * n)，其中是链表数组的长度， n是平均每个链表的长度。而对长链表进行排序的时间复杂度取决于排序算法的选择，例如快速排序的平均时间复杂度为 O(nlogn)，其中 n是长链表的长度，也就是所有链表长度之和。所以总体时间复杂度较高，但对于一些小规模的问题或者对时间要求不高的场景，这种方法仍然可以尝试。

（二）暴力求解优化法

暴力求解优化法是对暴力排序法的一种改进。它的核心思想是每次取出 K个链表中最小的元素，不断放入结果数组中。具体实现时，可以通过遍历 K个链表的首元素，找到其中最小的元素，将其加入结果数组，然后将该最小元素所在链表的指针向后移动一位。重复这个过程，直到所有链表都为空。这种方法在一定程度上减少了不必要的排序操作，但是时间复杂度仍然较高。每次查找最小元素需要遍历 K个链表，时间复杂度为 O(k)，假设总共有 n个元素，那么总体时间复杂度为 O(nk)。

（三）分治法

分治法是一种更加高效的方法。将 k个链表配对并将同一对中的链表合并。第一轮合并以后， k个链表被合并成了 k/2个链表，平均长度为 2n/k，然后是 k/4个链表，k/8 个链表等等。重复这一过程，直到我们得到了最终的有序链表。具体实现时，可以使用递归的方式进行合并。首先将链表数组分成两部分，分别对这两部分进行合并，然后再将合并后的结果进行合并。这种方法的时间复杂度为 O(n log k)，其中 n是所有链表的总长度，k 是链表数组的长度。因为每次合并的时间复杂度为 O(n)，而总共需要进行 log k次合并。

（四）堆排序或构建二叉排序树法

堆排序或构建二叉排序树法为解决这个问题提供了不同的思路。对于堆排序，可以使用小根堆来存储链表的首元素。每次从堆中取出最小的元素，将其加入结果链表，然后将该元素所在链表的下一个元素加入堆中。这样可以保证每次取出的元素都是当前未处理元素中的最小值。时间复杂度为 O(n log k)，其中 n是所有链表的总长度，k 是链表数组的长度。对于构建二叉排序树，可以将每个链表的元素依次插入二叉排序树中，然后进行中序遍历得到有序链表。这种方法的时间复杂度取决于二叉排序树的构建和遍历，一般情况下时间复杂度也为 O(n log k)。具体的实现可以参考相关博客中的更基础概念和示例代码。

二、代码实现

（一）暴力排序法

#include <stdio.h>
#include <stdlib.h>

// 链表节点结构
struct ListNode {
    int val;
    struct ListNode* next;
};

// 创建新节点
struct ListNode* createNode(int val) {
    // 分配内存空间给新节点
    struct ListNode* newNode = (struct ListNode*)malloc(sizeof(struct ListNode));
    // 设置新节点的值
    newNode->val = val;
    // 新节点的下一个指针初始化为 NULL
    newNode->next = NULL;
    return newNode;
}

// 插入节点到链表尾部
void insertNode(struct ListNode** head, int val) {
    // 创建新节点
    struct ListNode* new = createNode(val);
    // 如果链表为空，将新节点设为链表的头节点
    if (*head == NULL) {
        *head = new;
        return;
    }
    // 临时指针指向链表的头节点
    struct ListNode* temp = *head;
    // 遍历链表找到最后一个节点
    while (temp->next!= NULL) {
        temp = temp->next;
    }
    // 将新节点连接到链表的末尾
    temp->next = new;
}

// 合并 k 个链表（暴力排序法）
struct ListNode* mergeKListsBruteForce(struct ListNode** lists, int listsSize) {
    // 初始化结果链表为空
    struct ListNode* result = NULL;
    // 遍历输入的链表数组
    for (int i = 0; i < listsSize; i++) {
        // 获取当前链表
        struct ListNode* currentList = lists[i];
        // 遍历当前链表的所有节点
        while (currentList!= NULL) {
            // 将当前链表的节点值插入到结果链表中
            insertNode(&result, currentList->val);
            // 移动到当前链表的下一个节点
            currentList = currentList->next;
        }
    }

    // 对合并后的链表进行排序
    struct ListNode* current = result;
    while (current!= NULL) {
        // 获取当前节点的下一个节点
        struct ListNode* next = current->next;
        while (next!= NULL) {
            // 如果当前节点的值大于下一个节点的值，则交换它们的值
            if (current->val > next->val) {
                int temp = current->val;
                current->val = next->val;
                next->val = temp;
            }
            // 移动到下一个节点
            next = next->next;
        }
        // 移动到下一个节点
        current = current->next;
    }

    return result;
}

（二）暴力求解优化法

#include <stdio.h>
#include <stdlib.h>

// 链表节点结构
struct ListNode {
    int val;
    struct ListNode* next;
};

// 创建新节点
struct ListNode* createNode(int val) {
    // 分配内存空间给新节点
    struct ListNode* newNode = (struct ListNode*)malloc(sizeof(struct ListNode));
    // 设置新节点的值
    newNode->val = val;
    // 新节点的下一个指针初始化为 NULL
    newNode->next = NULL;
    return newNode;
}

// 插入节点到链表尾部
void insertNode(struct ListNode** head, int val) {
    // 创建新节点
    struct ListNode* new = createNode(val);
    // 如果链表为空，将新节点设为链表的头节点
    if (*head == NULL) {
        *head = new;
        return;
    }
    // 临时指针指向链表的头节点
    struct ListNode* temp = *head;
    // 遍历链表找到最后一个节点
    while (temp->next!= NULL) {
        temp = temp->next;
    }
    // 将新节点连接到链表的末尾
    temp->next = new;
}

// 查找 k 个链表中的最小节点所在的链表索引
int findMinIndex(struct ListNode** lists, int listsSize) {
    // 初始化最小索引为 -1，表示还未找到最小节点所在的链表
    int minIndex = -1;
    // 初始化最小值为整数最大值
    int minVal = __INT_MAX__;
    // 遍历所有链表
    for (int i = 0; i < listsSize; i++) {
        // 如果当前链表不为空且当前链表的头节点值小于当前最小值
        if (lists[i]!= NULL && lists[i]->val < minVal) {
            // 更新最小值
            minVal = lists[i]->val;
            // 更新最小索引
            minIndex = i;
        }
    }
    return minIndex;
}

// 合并 k 个链表（暴力求解优化法）
struct ListNode* mergeKListsOptimized(struct ListNode** lists, int listsSize) {
    // 创建一个虚拟头节点
    struct ListNode* dummy = createNode(0);
    // 当前节点指针，初始指向虚拟头节点
    struct ListNode* current = dummy;
    // 记录非空链表的数量
    int nonEmptyLists = listsSize;
    // 当还有非空链表时循环
    while (nonEmptyLists > 0) {
        // 找到 k 个链表中最小节点所在的链表索引
        int minIndex = findMinIndex(lists, listsSize);
        // 如果找到了非空链表
        if (minIndex!= -1) {
            // 将最小节点连接到结果链表中
            current->next = lists[minIndex];
            // 当前节点指针后移
            current = current->next;
            // 移动最小链表的头指针到下一个节点
            lists[minIndex] = lists[minIndex]->next;
            // 如果该链表为空，减少非空链表数量
            if (lists[minIndex] == NULL) {
                nonEmptyLists--;
            }
        }
    }
    // 返回合并后的链表（不包括虚拟头节点）
    return dummy->next;
}

（三）分治法

#include <stdio.h>
#include <stdlib.h>

// 链表节点结构
struct ListNode {
    int val;
    struct ListNode* next;
};

// 创建新节点
struct ListNode* createNode(int val) {
    // 分配内存空间给新节点
    struct ListNode* newNode = (struct ListNode*)malloc(sizeof(struct ListNode));
    // 设置新节点的值
    newNode->val = val;
    // 新节点的下一个指针初始化为 NULL
    newNode->next = NULL;
    return newNode;
}

// 插入节点到链表尾部
void insertNode(struct ListNode** head, int val) {
    // 创建新节点
    struct ListNode* new = createNode(val);
    // 如果链表为空，将新节点设为链表的头节点
    if (*head == NULL) {
        *head = new;
        return;
    }
    // 临时指针指向链表的头节点
    struct ListNode* temp = *head;
    // 遍历链表找到最后一个节点
    while (temp->next!= NULL) {
        temp = temp->next;
    }
    // 将新节点连接到链表的末尾
    temp->next = new;
}

// 合并两个升序链表
struct ListNode* mergeTwoLists(struct ListNode* l1, struct ListNode* l2) {
    // 创建一个虚拟头节点
    struct ListNode dummy;
    // 指向虚拟头节点的指针，用于构建合并后的链表
    struct ListNode* tail = &dummy;
    // 当两个链表都不为空时循环
    while (l1 && l2) {
        // 如果第一个链表当前节点值小于第二个链表当前节点值
        if (l1->val < l2->val) {
            // 将第一个链表当前节点连接到结果链表
            tail->next = l1;
            // 移动第一个链表指针到下一个节点
            l1 = l1->next;
        } else {
            // 将第二个链表当前节点连接到结果链表
            tail->next = l2;
            // 移动第二个链表指针到下一个节点
            l2 = l2->next;
        }
        // 移动结果链表指针到新连接的节点
        tail = tail->next;
    }
    // 将剩余的非空链表连接到结果链表末尾
    tail->next = l1? l1 : l2;
    // 返回合并后的链表（不包括虚拟头节点）
    return dummy.next;
}

// 分治法合并 k 个链表
struct ListNode* mergeKListsDivideAndConquer(struct ListNode** lists, int start, int end) {
    // 如果起始索引等于结束索引，说明只有一个链表，直接返回该链表
    if (start == end) {
        return lists[start];
    }
    // 如果起始索引大于结束索引，说明没有链表可合并，返回 NULL
    if (start > end) {
        return NULL;
    }
    // 计算中间索引
    int mid = start + (end - start) / 2;
    // 递归合并左半部分链表
    struct ListNode* left = mergeKListsDivideAndConquer(lists, start, mid);
    // 递归合并右半部分链表
    struct ListNode* right = mergeKListsDivideAndConquer(lists, mid + 1, end);
    // 合并左右两部分已合并的链表
    return mergeTwoLists(left, right);
}

（四）堆排序或构建二叉排序树法

#include <stdio.h>
#include <stdlib.h>

// 链表节点结构
struct ListNode {
    int val;
    struct ListNode* next;
};

// 创建新节点
struct ListNode* createNode(int val) {
    // 分配内存空间给新节点
    struct ListNode* newNode = (struct ListNode*)malloc(sizeof(struct ListNode));
    // 设置新节点的值
    newNode->val = val;
    // 新节点的下一个指针初始化为 NULL
    newNode->next = NULL;
    return newNode;
}

// 插入节点到链表尾部
void insertNode(struct ListNode** head, int val) {
    // 创建新节点
    struct ListNode* new = createNode(val);
    // 如果链表为空，将新节点设为链表的头节点
    if (*head == NULL) {
        *head = new;
        return;
    }
    // 临时指针指向链表的头节点
    struct ListNode* temp = *head;
    // 遍历链表找到最后一个节点
    while (temp->next!= NULL) {
        temp = temp->next;
    }
    // 将新节点连接到链表的末尾
    temp->next = new;
}

// 交换两个整数的值
void swap(int* a, int* b) {
    // 临时变量存储其中一个整数的值
    int temp = *a;
    // 将另一个整数的值赋给第一个整数
    *a = *b;
    // 将临时变量的值赋给第二个整数
    *b = temp;
}

// 堆调整函数
void heapify(int arr[], int n, int i) {
    // 初始化当前最大元素的索引为 i
    int largest = i;
    // 左子节点的索引
    int left = 2 * i + 1;
    // 右子节点的索引
    int right = 2 * i + 2;

    // 如果左子节点存在且比当前最大元素大
    if (left < n && arr[left] > arr[largest])
        largest = left;

    // 如果右子节点存在且比当前最大元素大
    if (right < n && arr[right] > arr[largest])
        largest = right;

    // 如果最大元素不是当前节点
    if (largest!= i) {
        // 交换当前节点和最大元素节点的值
        swap(&arr[i], &arr[largest]);
        // 递归调整新的子树
        heapify(arr, n, largest);
    }
}

// 构建堆
void buildHeap(int arr[], int n) {
    // 从最后一个非叶子节点开始调整堆
    for (int i = n / 2 - 1; i >= 0; i--)
        heapify(arr, n, i);
}

// 合并 k 个链表（堆排序法）
struct ListNode* mergeKListsHeap(struct ListNode** lists, int listsSize) {
    // 创建最小堆数组
    int minHeap[listsSize];
    int heapSize = 0;
    // 将每个链表的第一个节点的值加入最小堆数组
    for (int i = 0; i < listsSize; i++) {
        if (lists[i]!= NULL) {
            minHeap[heapSize++] = lists[i]->val;
        }
    }
    // 构建最小堆
    buildHeap(minHeap, heapSize);

    // 创建虚拟头节点
    struct ListNode dummy;
    struct ListNode* tail = &dummy;
    // 当堆不为空时循环
    while (heapSize > 0) {
        // 获取堆顶元素（最小元素）
        int minVal = minHeap[0];
        // 将最小元素加入结果链表
        tail->next = createNode(minVal);
        tail = tail->next;

        // 在链表数组中找到值为最小元素的链表，并将其头节点后移
        for (int i = 0; i < listsSize; i++) {
            if (lists[i]!= NULL && lists[i]->val == minVal) {
                lists[i] = lists[i]->next;
                if (lists[i]!= NULL) {
                    // 如果该链表不为空，将新的头节点值加入堆
                    minHeap[0] = lists[i]->val;
                } else {
                    // 如果该链表为空，用堆的最后一个元素替换堆顶元素，并减小堆大小
                    minHeap[0] = minHeap[--heapSize];
                }
                // 调整堆
                heapify(minHeap, heapSize, 0);
                break;
            }
        }
    }
    // 返回合并后的链表（不包括虚拟头节点）
    return dummy.next;
}

三、总结展望

1.暴力排序法：

优点：思路简单直接，容易理解和实现。对于小规模问题或者对时间要求不高的场景，可以快速解决问题。
缺点：时间复杂度高，特别是在处理大规模数据或者链表数量较多的情况时，效率低下。

2.暴力求解优化法：

优点：相比暴力排序法，减少了不必要的排序操作，在一定程度上提高了效率。对于一些特定的输入数据，可能会有较好的表现。
缺点：时间复杂度仍然较高，每次查找最小元素需要遍历所有链表，当链表数量较多时，效率会受到很大影响。

3.分治法：

优点：时间复杂度为，相比暴力方法有很大的提升。通过递归地合并链表，充分利用了链表已经升序排列的特点，减少了比较次数。
缺点：实现相对复杂，需要理解递归的思想和过程。在处理小规模问题时，可能由于递归调用的开销，效率不一定比其他方法高。

4.堆排序或构建二叉排序树法：

优点：时间复杂度为，能够快速找到当前最小的元素，保证合并后的链表始终是升序的。对于大规模数据和链表数量较多的情况，具有较好的性能。
缺点：需要构建和维护堆或二叉排序树，增加了空间复杂度和实现的复杂性。对于一些简单的场景，可能过于复杂。

（二）未来探索方向

进一步优化时间复杂度：可以探索更高效的算法和数据结构，以降低合并 k 个升序链表的时间复杂度。例如，研究新的分治策略或者改进堆排序的实现，以减少比较次数和操作次数。
空间复杂度的优化：在保证时间效率的同时，尽量降低空间复杂度。可以考虑使用更紧凑的数据结构或者优化算法的内存使用，以减少内存占用。
结合实际应用场景进行优化：根据不同的应用场景，对算法进行针对性的优化。例如，在数据库管理系统中，可以考虑利用数据库的索引结构来加速链表的合并；在图形处理中，可以根据图形的特点和需求，选择合适的合并策略。
并行计算的应用：对于大规模数据和链表数量较多的情况，可以考虑使用并行计算技术，将合并操作分配到多个处理器上同时进行，以提高效率。
动态调整算法：根据输入数据的特点和规模，动态地选择最合适的合并算法。例如，当链表数量较少时，可以使用简单的暴力方法；当链表数量较多时，自动切换到分治或堆排序方法。

总之，合并 k 个升序链表是一个具有挑战性的问题，通过不断地探索和创新，可以找到更高效、更实用的解决方案，为实际应用提供更好的支持。