C语言数据结构实现与应用

一一MIO一一

于 2024-08-29 11:25:35 发布

阅读量849

点赞数 15

本文链接：https://blog.csdn.net/weixin_33240461/article/details/141694480

版权

本文还有配套的精品资源，点击获取

简介：数据结构是计算机科学的基础，关系到数据的存储和操作效率。本资源提供了使用C语言实现的核心数据结构源代码，包括链表、数组、栈、队列、树、图、散列表、排序和查找算法等。这些代码不仅是学习数据结构的实用示例，也为开发者在解决各种编程问题时提供了参考。深入研究这些实现，可以帮助提高编程技能，并理解数据结构在实际应用中的重要性。

1. 链表的C语言实现与操作

链表作为一种常见的数据结构，以其灵活的插入和删除操作在程序设计中占据重要地位。C语言作为接近硬件的编程语言，对内存的控制能力强大，非常适合实现复杂的链表操作。

1.1 链表基础概念

链表是由一系列节点组成的集合，每个节点包含两部分数据：存储元素的数据域和指向下一个节点的指针域。在C语言中，我们通常使用结构体(struct)来定义节点。

typedef struct Node {
    int data;
    struct Node* next;
} Node;

1.2 单向链表的实现

单向链表的每个节点只包含一个指针，指向下一个节点。实现单向链表的关键操作包括初始化、插入、删除和遍历。

初始化

初始化一个空的链表，其头节点的指针域设置为NULL。

Node* createList() {
    Node* head = (Node*)malloc(sizeof(Node));
    if (head) {
        head->next = NULL;
    }
    return head;
}

插入节点

链表插入节点需要修改相邻节点的指针域，保证链表的连续性。

void insertNode(Node* head, int data) {
    Node* newNode = (Node*)malloc(sizeof(Node));
    if (newNode) {
        newNode->data = data;
        newNode->next = head->next;
        head->next = newNode;
    }
}

1.3 双向链表与循环链表

除了单向链表，还有双向链表和循环链表等复杂结构。双向链表的节点含有两个指针，分别指向前一个节点和下一个节点，而循环链表的尾节点指向头节点，形成一个环。

通过理解并实践这些基本操作，我们可以利用C语言灵活地管理和操作链表。这些技能对于数据结构和算法的学习至关重要，也能够帮助我们在处理复杂数据时提高程序的效率和响应速度。

2. 数组与多维数组的动态管理

2.1 动态数组的实现原理

2.1.1 动态内存分配与释放

在C语言中，动态数组的实现主要依赖于动态内存分配和释放的相关函数。动态内存分配是通过 malloc() , calloc() , realloc() 等函数在程序运行时从堆内存中分配所需的内存空间，而释放则通过 free() 函数来实现。

例如，创建一个动态数组时，可以使用 malloc() 函数，它接受一个参数，即需要分配的内存大小（以字节为单位）。创建成功后，返回指向分配内存的指针，如果分配失败则返回 NULL 。

int *arr = (int*)malloc(sizeof(int) * size);

在这个例子中， size 是需要分配的数组元素个数。 sizeof(int) 用来获取单个 int 类型元素所需的内存大小。

当动态数组不再需要时，应该使用 free() 函数来释放之前分配的内存。

free(arr);

注意，在释放内存后，指针变量 arr 应该设置为 NULL ，以避免悬挂指针的出现。

2.1.2 多维数组的动态管理技巧

多维数组的动态管理涉及到在堆上分配二维或更多维度的数组。对于二维数组，这通常意味着需要嵌套使用 malloc() 函数。

例如，创建一个 m 行 n 列的二维动态数组可以使用以下方法：

int **matrix = (int**)malloc(m * sizeof(int*));
for (int i = 0; i < m; i++) {
    matrix[i] = (int*)malloc(n * sizeof(int));
}

这里首先为指向指针的指针 matrix 分配内存，然后对每一行使用 malloc() 分配 n 个 int 的内存。为了完整性，在释放二维数组时，也需要嵌套使用 free() 函数。

for (int i = 0; i < m; i++) {
    free(matrix[i]);
}
free(matrix);

请注意，这种管理方式需要小心处理，否则容易造成内存泄漏或访问无效内存区域。

2.2 多维数组的应用实例

2.2.1 矩阵运算

在计算机科学中，矩阵运算是一种常见的多维数组应用实例。例如，二维数组经常被用于表示图像数据、进行线性代数运算等。

矩阵乘法是矩阵运算中的一种，它的C语言实现需要多个嵌套循环来完成。矩阵乘法的C语言实现涉及对两个矩阵的行和列进行迭代，并进行相应的乘加操作。

2.2.2 复杂数据的存储与处理

多维数组也可以用于存储和处理复杂数据。例如，可以使用三维数组来存储和处理三维空间数据，或者使用四维数组来表示四维数据结构，如时间序列数据。

在实际编程中，处理这些数据结构可能需要特别注意内存管理，以避免内存泄漏或访问未分配的内存。因此，合理地实现动态管理是处理复杂数据结构的关键。

通过本章节的介绍，我们可以了解到动态数组的实现原理与技巧，以及如何在实际应用中使用多维数组来处理复杂数据结构。对于更深层次的理解，我们将在后续章节中进一步探讨数组与其他数据结构之间的关联和交互。

3. 栈与队列的数据结构实践

3.1 栈的实现与操作

3.1.1 栈的基本概念与应用场景

栈（Stack）是一种特殊的线性表，它采用后进先出（Last In First Out, LIFO）的原则进行存储和访问数据。在栈中，新添加的元素始终存放在原有元素之上，移除元素时也总是从最近刚添加的那个元素开始移除。

栈的主要操作包括： - push ：将一个元素放入栈顶。 - pop ：移除栈顶元素。 - peek 或 top ：查看栈顶元素，但不移除它。

栈的应用场景非常广泛，例如： - 在编译器的表达式求值中用于括号匹配和算术运算。 - 在浏览器的后退功能中，利用栈记录访问过的页面。 - 在算法中实现深度优先搜索（DFS）等。

3.1.2 栈的顺序与链式实现

顺序栈实现

使用数组实现的栈称为顺序栈。数组的特性使得元素可以快速地被添加和移除。以下是一个使用C语言实现的顺序栈的示例代码：

#include <stdio.h>
#include <stdlib.h>
#include <stdbool.h>

#define MAXSIZE 10 // 定义栈的最大容量

typedef struct {
    int data[MAXSIZE];
    int top;
} SeqStack;

// 初始化栈
void initStack(SeqStack *s) {
    s->top = -1;
}

// 判断栈是否为空
bool isEmpty(SeqStack *s) {
    return s->top == -1;
}

// 判断栈是否已满
bool isFull(SeqStack *s) {
    return s->top == MAXSIZE - 1;
}

// 入栈操作
bool push(SeqStack *s, int x) {
    if (isFull(s)) {
        return false;
    }
    s->data[++s->top] = x;
    return true;
}

// 出栈操作
bool pop(SeqStack *s, int *x) {
    if (isEmpty(s)) {
        return false;
    }
    *x = s->data[s->top--];
    return true;
}

int main() {
    SeqStack s;
    initStack(&s);
    push(&s, 10);
    push(&s, 20);
    push(&s, 30);

    int x;
    while (!isEmpty(&s)) {
        pop(&s, &x);
        printf("%d\n", x);
    }

    return 0;
}

链式栈实现

链式栈是使用链表实现的栈，其每个节点包含数据部分和指针部分，指针指向前一个节点。链式栈不需要预定义大小，具有动态扩展和收缩的特性。以下是一个使用C语言实现的链式栈的示例代码：

#include <stdio.h>
#include <stdlib.h>

typedef struct StackNode {
    int data;
    struct StackNode *next;
} StackNode, *LinkStackPtr;

typedef struct {
    LinkStackPtr top;
    int count;
} LinkStack;

// 初始化栈
void initStack(LinkStack *s) {
    s->top = NULL;
    s->count = 0;
}

// 判断栈是否为空
bool isEmpty(LinkStack *s) {
    return s->count == 0;
}

// 入栈操作
bool push(LinkStack *s, int x) {
    LinkStackPtr node = (LinkStackPtr)malloc(sizeof(StackNode));
    if (!node) return false;
    node->data = x;
    node->next = s->top;
    s->top = node;
    s->count++;
    return true;
}

// 出栈操作
bool pop(LinkStack *s, int *x) {
    if (isEmpty(s)) {
        return false;
    }
    LinkStackPtr temp = s->top;
    *x = temp->data;
    s->top = temp->next;
    free(temp);
    s->count--;
    return true;
}

int main() {
    LinkStack s;
    initStack(&s);
    push(&s, 10);
    push(&s, 20);
    push(&s, 30);

    int x;
    while (!isEmpty(&s)) {
        pop(&s, &x);
        printf("%d\n", x);
    }

    return 0;
}

3.1.3 栈的性能分析

栈的性能主要取决于其基本操作的执行时间。对于顺序栈， push 和 pop 操作的时间复杂度均为O(1)，因为它们只涉及对栈顶指针的简单操作。然而，栈的空间大小受限于预先定义的数组大小。

链式栈同样提供了O(1)时间复杂度的 push 和 pop 操作，但由于其动态内存分配的特性，它不受固定大小的限制。但每次操作时需要额外的时间来分配和回收内存。

3.2 队列的实现与操作

3.2.1 队列的基本概念与应用场景

队列（Queue）是一种先进先出（First In First Out, FIFO）的线性表，它有两个指针，分别指向队首和队尾。在队列中，第一个进入的元素总是第一个被取出。

队列的主要操作包括： - enqueue ：在队尾添加一个元素。 - dequeue ：从队首移除一个元素。 - front ：查看队首元素，但不移除它。

队列的应用场景也相当广泛，例如： - 在操作系统中用于进程和线程的调度。 - 在网络协议中，如TCP/IP中的数据包传输。 - 在日常生活中，例如银行柜台服务的排队系统。

3.2.2 队列的顺序与链式实现

顺序队列实现

顺序队列使用数组来存储数据。由于队列的先进先出特性，我们通常使用两个指针（一个指向队首，另一个指向队尾）来跟踪元素的插入和删除位置。以下是使用C语言实现的顺序队列的示例代码：

#include <stdio.h>
#include <stdlib.h>
#include <stdbool.h>

#define MAXSIZE 10 // 定义队列的最大容量

typedef struct {
    int data[MAXSIZE];
    int front;
    int rear;
} SeqQueue;

// 初始化队列
void initQueue(SeqQueue *q) {
    q->front = 0;
    q->rear = 0;
}

// 判断队列是否为空
bool isEmpty(SeqQueue *q) {
    return q->front == q->rear;
}

// 判断队列是否已满
bool isFull(SeqQueue *q) {
    return (q->rear + 1) % MAXSIZE == q->front;
}

// 入队操作
bool enqueue(SeqQueue *q, int x) {
    if (isFull(q)) {
        return false;
    }
    q->data[q->rear] = x;
    q->rear = (q->rear + 1) % MAXSIZE;
    return true;
}

// 出队操作
bool dequeue(SeqQueue *q, int *x) {
    if (isEmpty(q)) {
        return false;
    }
    *x = q->data[q->front];
    q->front = (q->front + 1) % MAXSIZE;
    return true;
}

int main() {
    SeqQueue q;
    initQueue(&q);
    enqueue(&q, 10);
    enqueue(&q, 20);
    enqueue(&q, 30);

    int x;
    while (!isEmpty(&q)) {
        dequeue(&q, &x);
        printf("%d\n", x);
    }

    return 0;
}

链式队列实现

链式队列使用链表来存储数据。链式队列不存在预定义大小的问题，且可以灵活地进行元素的添加和删除。以下是使用C语言实现的链式队列的示例代码：

#include <stdio.h>
#include <stdlib.h>

typedef struct QueueNode {
    int data;
    struct QueueNode *next;
} QueueNode, *LinkQueuePtr;

typedef struct {
    LinkQueuePtr front;
    LinkQueuePtr rear;
} LinkQueue;

// 初始化队列
void initQueue(LinkQueue *q) {
    q->front = q->rear = (LinkQueuePtr)malloc(sizeof(QueueNode));
    if (!q->front) exit(0);
    q->front->next = NULL;
}

// 判断队列是否为空
bool isEmpty(LinkQueue *q) {
    return q->front == q->rear;
}

// 入队操作
bool enqueue(LinkQueue *q, int x) {
    LinkQueuePtr node = (LinkQueuePtr)malloc(sizeof(QueueNode));
    if (!node) return false;
    node->data = x;
    node->next = NULL;
    q->rear->next = node;
    q->rear = node;
    return true;
}

// 出队操作
bool dequeue(LinkQueue *q, int *x) {
    if (isEmpty(q)) {
        return false;
    }
    LinkQueuePtr temp = q->front->next;
    *x = temp->data;
    q->front->next = temp->next;
    if (q->rear == temp) {
        q->rear = q->front;
    }
    free(temp);
    return true;
}

int main() {
    LinkQueue q;
    initQueue(&q);
    enqueue(&q, 10);
    enqueue(&q, 20);
    enqueue(&q, 30);

    int x;
    while (!isEmpty(&q)) {
        dequeue(&q, &x);
        printf("%d\n", x);
    }

    return 0;
}

3.2.3 队列的性能分析

与栈类似，队列的性能也主要取决于其基本操作的执行时间。对于顺序队列， enqueue 和 dequeue 操作的时间复杂度也是O(1)，但同样受限于预定义的数组大小。链式队列在 enqueue 和 dequeue 操作上也具有O(1)的时间复杂度，但它需要额外的空间来存储节点指针，并在每次操作中分配和释放内存。

4. 树结构及其算法实现

树结构是计算机科学中非常重要的一个概念，它提供了一种层次化的数据组织方式。通过树形结构，可以方便地表示如文件系统、组织结构、网络路由等许多复杂的数据关系。本章将深入探讨二叉树的构建与遍历以及平衡树的优化与应用，为读者提供树结构及其算法实现的全面视角。

4.1 二叉树的构建与遍历

4.1.1 二叉树的基本理论

二叉树是每个节点最多有两个子树的树结构，通常子树被称作“左子树”和“右子树”。二叉树在计算机科学中有广泛的应用，例如二叉搜索树、堆和表达式树等。二叉树的遍历通常有三种方式：前序遍历、中序遍历和后序遍历。

前序遍历 ：首先访问根节点，然后递归地进行前序遍历左子树，接着递归地进行前序遍历右子树。
中序遍历 ：首先递归地进行中序遍历左子树，然后访问根节点，最后递归地进行中序遍历右子树。
后序遍历 ：首先递归地进行后序遍历左子树，接着递归地进行后序遍历右子树，最后访问根节点。

4.1.2 前序、中序、后序遍历算法

在二叉树的遍历中，递归是一种简洁明了的实现方式。下面提供了使用C语言实现的前序、中序和后序遍历的示例代码。

#include <stdio.h>
#include <stdlib.h>

typedef struct TreeNode {
    int value;
    struct TreeNode* left;
    struct TreeNode* right;
} TreeNode;

// 创建新节点
TreeNode* createNode(int value) {
    TreeNode* newNode = (TreeNode*)malloc(sizeof(TreeNode));
    if (!newNode) {
        return NULL;
    }
    newNode->value = value;
    newNode->left = NULL;
    newNode->right = NULL;
    return newNode;
}

// 前序遍历
void preorderTraversal(TreeNode* root) {
    if (root == NULL) {
        return;
    }
    printf("%d ", root->value);
    preorderTraversal(root->left);
    preorderTraversal(root->right);
}

// 中序遍历
void inorderTraversal(TreeNode* root) {
    if (root == NULL) {
        return;
    }
    inorderTraversal(root->left);
    printf("%d ", root->value);
    inorderTraversal(root->right);
}

// 后序遍历
void postorderTraversal(TreeNode* root) {
    if (root == NULL) {
        return;
    }
    postorderTraversal(root->left);
    postorderTraversal(root->right);
    printf("%d ", root->value);
}

int main() {
    // 构建测试用的二叉树
    TreeNode* root = createNode(1);
    root->left = createNode(2);
    root->right = createNode(3);
    root->left->left = createNode(4);
    root->left->right = createNode(5);
    root->right->left = createNode(6);
    root->right->right = createNode(7);

    // 执行遍历
    printf("前序遍历: ");
    preorderTraversal(root);
    printf("\n");

    printf("中序遍历: ");
    inorderTraversal(root);
    printf("\n");

    printf("后序遍历: ");
    postorderTraversal(root);
    printf("\n");

    return 0;
}

在上述代码中，每个遍历函数都先检查当前节点是否为空，如果不为空，则执行相应的操作（访问节点值），然后递归地调用左子树和右子树的遍历函数。这种递归调用的模式允许我们以深度优先的方式遍历整个树。

4.2 平衡树的优化与应用

4.2.1 AVL树和红黑树的原理与实现

平衡树是指任何节点的两个子树的高度差不会超过1的树，它的目的是为了保持树的平衡，以便在其中查找、插入和删除操作能够保持较高的效率。AVL树和红黑树是两种常见的自平衡二叉搜索树。

AVL树 ：每个节点的左子树和右子树的高度最多相差1。为了维持这种平衡，AVL树在进行插入和删除操作时，需要进行旋转操作。
红黑树 ：它通过在每个节点上增加了一个存储位来表示节点的颜色，可以是红色或黑色。通过对任何一条从根到叶子的路径上各个节点的颜色进行约束，红黑树确保没有一条路径会比其他路径长出两倍，因而是近似平衡的。

下面是一个简化的AVL树节点的定义和旋转操作的伪代码，由于篇幅限制，未提供完整的红黑树实现代码。

typedef struct AVLTreeNode {
    int value;
    struct AVLTreeNode* left;
    struct AVLTreeNode* right;
    int height; // 节点的高度
} AVLTreeNode;

// AVL树左旋转
AVLTreeNode* rotateLeft(AVLTreeNode* p) {
    // ... 实现左旋转逻辑
}

// AVL树右旋转
AVLTreeNode* rotateRight(AVLTreeNode* p) {
    // ... 实现右旋转逻辑
}

// ... 其他AVL树相关操作

4.2.2 平衡树在实际问题中的应用

平衡树在实际问题中有广泛的应用，例如：

数据库索引 ：数据库系统通常使用B树或B+树（一种平衡树变种）来组织索引，以提高数据检索的效率。
内存管理 ：如红黑树在Java的TreeMap和TreeSet中被用作内部数据结构。
负载均衡 ：AVL树等平衡树结构也可用于实现高效的负载均衡策略。

平衡树通过其高度平衡的特性，将最坏情况下的时间复杂度控制在对数级别，使得它们在数据量大且操作频繁的场景下表现优异。然而，平衡树的维护代价也相对较高，因此在选择数据结构时需要根据应用场景的实际情况进行权衡。

5. 图的数据表示与图算法

5.1 图的表示方法

图是由一组顶点和连接这些顶点的边组成的抽象数据结构。在计算机科学中，图被广泛用于模拟复杂的网络结构和关系。有效地表示图是图算法实践的基础。

5.1.1 邻接矩阵与邻接表的优缺点

在图的众多表示方法中，邻接矩阵和邻接表是最常用的两种。

邻接矩阵 ：一个二维数组，其中的每个元素表示顶点之间是否有边相连接。如果顶点i和顶点j之间有边，则matrix[i][j]为true或1；否则为false或0。

#define MAX_VERTICES 10
int matrix[MAX_VERTICES][MAX_VERTICES] = {0};

邻接表 ：每个顶点有一个链表，链表中存储的是与该顶点相邻的顶点。这种表示方法在稀疏图中比邻接矩阵更加节省空间。

typedef struct ArcNode {
    int adjvex; // 邻接点域
    struct ArcNode *nextarc; // 链域
} ArcNode;

typedef struct VNode {
    int data; // 数据域
    ArcNode *firstarc; // 边表头指针
} VNode, AdjList[MAX_VERTICES];

typedef struct {
    AdjList vertices;
    int vexnum, arcnum; // 图中当前的顶点数和弧数
} ALGraph;

邻接矩阵适合表示稠密图，因为可以快速判断任意两个顶点之间是否有边相连接。而邻接表适合表示稀疏图，因为它不需要存储无边的信息，从而节省空间。

5.1.2 图的存储结构选择

图的存储结构选择依赖于具体的应用场景和图的特性。选择合适的数据结构可以大幅提升图算法的效率。

稠密图 ：如果图中的大多数顶点都相互连接，那么使用邻接矩阵较为适合。
稀疏图 ：如果图中只有少部分顶点相互连接，那么邻接表是更优的选择。
有向图 和 无向图 ：有向图的邻接矩阵不对称，无向图的邻接矩阵对称。
带权图 和 非带权图 ：带权图需要在邻接矩阵或邻接表中额外存储权值信息。

5.2 图的基本算法

图的基本算法包括图的遍历、最短路径、最小生成树等。这里我们主要探讨图的遍历算法。

5.2.1 深度优先搜索(DFS)

深度优先搜索是一种用于图的遍历或者搜索树结构的算法。在遍历过程中，DFS会尽可能深地搜索图的分支。

void DFS(int v, Graph *G, bool visited[]) {
    visited[v] = true;
    printf("%d ", v);
    for (int i = 0; i < G->numVertices; ++i) {
        if (G->adjMatrix[v][i] && !visited[i]) {
            DFS(i, G, visited);
        }
    }
}

DFS通过递归或栈实现，能够访问所有与顶点v可达的顶点。它常用于路径查找和拓扑排序。

5.2.2 广度优先搜索(BFS)

广度优先搜索是另一种图遍历算法，与深度优先搜索不同的是，它优先遍历离顶点最近的顶点。

void BFS(int v, Graph *G, bool visited[]) {
    Queue Q;
    Enqueue(Q, v);
    visited[v] = true;
    while (!IsEmpty(Q)) {
        v = Dequeue(Q);
        printf("%d ", v);
        for (int i = 0; i < G->numVertices; ++i) {
            if (G->adjMatrix[v][i] && !visited[i]) {
                Enqueue(Q, i);
                visited[i] = true;
            }
        }
    }
}

BFS使用队列来实现，从顶点v开始，访问其所有邻接点，然后再对每个邻接点执行相同的操作。BFS常用于最短路径问题。

5.2.3 最短路径算法(Dijkstra)

Dijkstra算法是用来在加权图中找到单源最短路径的一种算法。

void Dijkstra(Graph *G, int src) {
    int dist[MAX_VERTICES];
    bool sptSet[MAX_VERTICES] = {false};
    for (int i = 0; i < G->numVertices; ++i) {
        dist[i] = INT_MAX;
        sptSet[i] = false;
    }
    dist[src] = 0;
    for (int count = 0; count < G->numVertices - 1; ++count) {
        int u = MinDistance(dist, sptSet);
        sptSet[u] = true;
        for (int v = 0; v < G->numVertices; ++v) {
            if (!sptSet[v] && G->adjMatrix[u][v] && 
                dist[u] + G->adjMatrix[u][v] < dist[v]) {
                dist[v] = dist[u] + G->adjMatrix[u][v];
            }
        }
    }
}

Dijkstra算法通过迭代地确定最短路径树上所有顶点的最短路径，直到所有的顶点都被处理过。这个算法适用于没有负权边的图。

图算法是计算机科学中的一个复杂且重要的领域，它的应用范围广泛，包括网络路由、社交网络分析、地图导航等多个领域。通过深入理解和掌握图的数据表示和图算法，可以有效地解决各种实际问题。

6. 散列表的实现与冲突解决

6.1 散列表的基本概念

6.1.1 哈希表的原理与应用场景

哈希表是一种基于哈希函数的快速查找数据结构，它将键映射到数组中存储值的位置，从而实现对数据的快速访问。在理想情况下，哈希函数能将每个键均匀地映射到哈希表中，这样在进行查找操作时，平均情况下只需要常数时间即可完成。

哈希表的应用场景非常广泛，包括但不限于：

缓存机制：用于实现数据缓存，快速读取和更新缓存数据。
数据库索引：数据库系统常使用哈希表来实现索引，加速数据的查找速度。
符号表：编程语言的编译器通常使用哈希表来存储变量和符号的名称。
安全应用：哈希函数是密码学中的一项重要技术，用于消息摘要和数字签名的生成。

6.1.2 哈希函数的设计要点

设计一个良好的哈希函数对于提高哈希表性能至关重要。一个优秀的哈希函数需要满足以下条件：

高效计算：哈希函数应该能够快速计算出键的哈希值。
均匀分布：不同的键应该有较大的概率映射到不同的数组位置，以减少冲突。
确定性：相同的键在任何情况下都应该产生相同的哈希值。
简单性：哈希函数应尽量简单，以降低计算和实现的复杂度。

接下来，我们将探讨几种解决哈希表冲突的方法。

6.2 冲突解决方法

哈希冲突是指两个不同的键经过哈希函数计算后得到相同的哈希值。解决冲突的方法主要有以下几种。

6.2.1 开放寻址法

开放寻址法是指当发生冲突时，通过某种探测顺序在哈希表中寻找下一个空槽来存储冲突的数据。常见的开放寻址法有线性探测、二次探测和双散列。

线性探测法

线性探测法以线性方式遍历哈希表，直到找到一个空槽。例如，如果哈希值为 index 的位置已被占用，那么就从 index+1 开始，依此类推，直到找到一个空槽。

// 线性探测法的伪代码
index = hash(key) % array_size;
while (array[index] is occupied) {
    index = (index + 1) % array_size;
}
array[index] = value;

二次探测法

二次探测法在探测时使用二次方的增量。如果哈希值为 index 的位置被占用，则从 index+1 、 index+4 、 index+9 ...等位置寻找空槽。

// 二次探测法的伪代码
index = hash(key) % array_size;
offset = 1;
while (array[index] is occupied) {
    index = (hash(key) + offset^2) % array_size;
    offset++;
}
array[index] = value;

双散列法

双散列法使用另一个哈希函数来计算增量。如果 hash1(key) 是第一个哈希函数，那么探测的序列可以是 hash1(key) + i * hash2(key) ，其中 i 是从 0 开始的探测次数。

// 双散列法的伪代码
index = hash1(key) % array_size;
increment = hash2(key);
while (array[index] is occupied) {
    index = (index + increment) % array_size;
}
array[index] = value;

6.2.2 链地址法

链地址法是解决哈希冲突的另一种方法。在这种方法中，哈希表的每个槽位实际上是一个链表，所有冲突的元素都存储在这个链表中。这种方法的优点是实现简单，缺点是可能会增加链表操作的开销。

// 链地址法的伪代码
list[index] = append(list[index], key-value pair);

6.2.3 双重散列

双重散列是一种特殊类型的哈希技术，它结合了开放寻址法和链地址法。当哈希值产生冲突时，使用第二个哈希函数来计算探测的步长。

// 双重散列法的伪代码
index = hash1(key) % array_size;
increment = hash2(key) % (array_size - 1);
while (array[index] is occupied) {
    index = (index + increment) % array_size;
}
array[index] = value;

双重散列能够在一定程度上减少开放寻址法中的聚集现象，从而提高哈希表的性能。

6.2.4 哈希表的应用实例

为了更直观地理解哈希表及其冲突解决方法的应用，我们可以考虑一个具体的例子，例如使用哈希表来存储和检索大量字符串。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define TABLE_SIZE 1000

typedef struct HashTableEntry {
    char *key;
    char *value;
    struct HashTableEntry *next;
} HashTableEntry;

HashTableEntry *hash_table[TABLE_SIZE];

unsigned int hash(char *key) {
    unsigned long int value = 0;
    unsigned int i = 0;
    unsigned int key_len = strlen(key);

    for (; i < key_len; ++i) {
        value = value * 37 + key[i];
    }

    return value % TABLE_SIZE;
}

HashTableEntry *create_entry(char *key, char *value) {
    HashTableEntry *entry = malloc(sizeof(HashTableEntry));
    entry->key = malloc(strlen(key) + 1);
    strcpy(entry->key, key);
    entry->value = malloc(strlen(value) + 1);
    strcpy(entry->value, value);
    entry->next = NULL;

    return entry;
}

void insert_entry(char *key, char *value) {
    unsigned int slot = hash(key);
    HashTableEntry *entry = hash_table[slot];

    if (entry == NULL) {
        hash_table[slot] = create_entry(key, value);
    } else {
        while (entry->next != NULL) {
            entry = entry->next;
        }

        entry->next = create_entry(key, value);
    }
}

char *find_entry(char *key) {
    unsigned int slot = hash(key);
    HashTableEntry *entry = hash_table[slot];

    while (entry != NULL) {
        if (strcmp(entry->key, key) == 0) {
            return entry->value;
        }
        entry = entry->next;
    }

    return NULL;
}

int main() {
    insert_entry("key1", "value1");
    insert_entry("key2", "value2");

    char *value = find_entry("key1");
    if (value != NULL) {
        printf("Found: %s\n", value);
    } else {
        printf("Key not found.\n");
    }

    return 0;
}

这个例子中，我们定义了一个简单的哈希表结构，并实现了插入和查找功能。我们使用链地址法来处理冲突。

总结而言，散列表是现代数据处理中不可或缺的数据结构之一，而理解其基本概念、哈希函数的设计以及冲突解决方法对于IT专业人员来说至关重要。在下一章，我们将进入图的数据表示与图算法的世界，探索这些复杂但功能强大的数据结构和算法。

7. 排序与查找算法的C实现

在计算机科学中，排序与查找算法是基础且重要的主题，它们在各种软件系统中发挥着核心作用。本章节将深入探讨常见排序算法的C语言实现，以及查找算法的深度剖析。

7.1 常见排序算法的C语言实现

排序算法用于将一组数据按照特定的顺序排列。尽管排序算法有很多种，但每种都有其适用场景和效率差异。本小节将介绍冒泡、选择、插入排序，以及快速排序和归并排序的原理与C语言实现。

7.1.1 冒泡、选择、插入排序的原理与代码

这些基础排序算法适用于小型数据集或教学目的。

冒泡排序 ：通过重复遍历要排序的数列，比较每对相邻元素，若顺序错误就交换，直到没有需要交换的元素为止。其时间复杂度为O(n^2)。

void bubbleSort(int arr[], int n) {
    int i, j, temp;
    for (i = 0; i < n-1; i++) {
        for (j = 0; j < n-i-1; j++) {
            if (arr[j] > arr[j+1]) {
                temp = arr[j];
                arr[j] = arr[j+1];
                arr[j+1] = temp;
            }
        }
    }
}

选择排序 ：在未排序序列中找到最小（大）元素，存放到排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。其时间复杂度为O(n^2)。

void selectionSort(int arr[], int n) {
    int i, j, min_idx, temp;
    for (i = 0; i < n-1; i++) {
        min_idx = i;
        for (j = i+1; j < n; j++) {
            if (arr[j] < arr[min_idx]) {
                min_idx = j;
            }
        }
        temp = arr[min_idx];
        arr[min_idx] = arr[i];
        arr[i] = temp;
    }
}

插入排序 ：通过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。其时间复杂度也是O(n^2)。

void insertionSort(int arr[], int n) {
    int i, key, j;
    for (i = 1; i < n; i++) {
        key = arr[i];
        j = i - 1;
        while (j >= 0 && arr[j] > key) {
            arr[j + 1] = arr[j];
            j = j - 1;
        }
        arr[j + 1] = key;
    }
}

7.1.2 快速排序的优化与实现

快速排序是一种分而治之的排序算法，它使用高效的分区算法，并在分区内进行递归排序。其平均时间复杂度为O(n log n)。

void swap(int* a, int* b) {
    int t = *a;
    *a = *b;
    *b = t;
}

int partition(int arr[], int low, int high) {
    int pivot = arr[high];
    int i = (low - 1);
    for (int j = low; j <= high- 1; j++) {
        if (arr[j] < pivot) {
            i++;
            swap(&arr[i], &arr[j]);
        }
    }
    swap(&arr[i + 1], &arr[high]);
    return (i + 1);
}

void quickSort(int arr[], int low, int high) {
    if (low < high) {
        int pi = partition(arr, low, high);
        quickSort(arr, low, pi - 1);
        quickSort(arr, pi + 1, high);
    }
}

7.1.3 归并排序及其递归实现

归并排序算法同样属于分而治之的算法，它将数列分成两半，分别对它们递归地应用归并排序，然后将结果合并起来。其时间复杂度为O(n log n)。

void merge(int arr[], int l, int m, int r) {
    int i, j, k;
    int n1 = m - l + 1;
    int n2 = r - m;
    int L[n1], R[n2];

    for (i = 0; i < n1; i++)
        L[i] = arr[l + i];
    for (j = 0; j < n2; j++)
        R[j] = arr[m + 1 + j];

    i = 0;
    j = 0;
    k = l;
    while (i < n1 && j < n2) {
        if (L[i] <= R[j]) {
            arr[k] = L[i];
            i++;
        } else {
            arr[k] = R[j];
            j++;
        }
        k++;
    }

    while (i < n1) {
        arr[k] = L[i];
        i++;
        k++;
    }

    while (j < n2) {
        arr[k] = R[j];
        j++;
        k++;
    }
}

void mergeSort(int arr[], int l, int r) {
    if (l < r) {
        int m = l + (r - l) / 2;
        mergeSort(arr, l, m);
        mergeSort(arr, m + 1, r);
        merge(arr, l, m, r);
    }
}

7.2 查找算法的深度剖析

查找算法用于在数据集中检索特定元素，其效率直接影响到数据访问的速度。本小节将介绍二分查找的优化方法，以及线性查找和哈希查找的比较。

7.2.1 二分查找的优化

二分查找要求数据预先排序。其基本思想是：在有序数组中查找某个元素时，先比较数组中间的元素与目标值，如果相等则查找成功；如果目标值比中间元素小，则在数组的左半部分继续查找；否则，在右半部分查找。二分查找的时间复杂度为O(log n)。

int binarySearch(int arr[], int l, int r, int x) {
    while (l <= r) {
        int m = l + (r - l) / 2;
        if (arr[m] == x) {
            return m;
        }
        if (arr[m] < x) {
            l = m + 1;
        } else {
            r = m - 1;
        }
    }
    return -1;
}

优化方面可考虑非递归实现以节省栈空间，以及在整数类型数组中处理溢出问题。

7.2.2 线性查找与哈希查找比较

线性查找 ：从头到尾遍历数据集，是查找算法中最简单直接的方法，适用于未排序或小型数据集。时间复杂度为O(n)。

int linearSearch(int arr[], int n, int x) {
    for (int i = 0; i < n; i++) {
        if (arr[i] == x) return i;
    }
    return -1;
}

哈希查找 ：使用哈希函数将数据映射到表中的位置进行查找。其查找效率依赖于哈希函数和冲突解决策略。时间复杂度理论上为O(1)。

在比较这些算法时，需要考虑到数据集的规模、数据是否有序以及是否对查找速度有严格的实时性要求等因素。线性查找简单，但速度慢；二分查找快，但需要有序数据；哈希查找理论上最快，但可能需要额外的空间和复杂的数据结构。

通过上述章节内容，我们可以看到排序与查找算法在计算机程序设计中的重要性和实用性。不同算法的实现与适用场景，对于优化数据处理与分析具有不可忽视的作用。

本文还有配套的精品资源，点击获取

一一MIO一一

关注

15
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫