向量与列表 | 数据结构

最新推荐文章于 2024-01-21 03:29:51 发布

钠文

最新推荐文章于 2024-01-21 03:29:51 发布

阅读量126

点赞数

文章标签：数据结构算法排序算法

本文链接：https://blog.csdn.net/m0_60235585/article/details/128332001

版权

数据结构课程体系：数据逻辑结构设计 + 存储结构实现+ 运算接口实现
逻辑结构的设计来源于算法的设计，后两者的实现实际上是算法的实现

文章目录

@[toc]
递归的时间复杂度的计算
向量
自动扩充
排序
唯一化
查找

列表
存储与构建
插入/删除节点
唯一化
归并排序

递归的时间复杂度的计算

写时间复杂度的递推式
减治:return sum(n-1)+A[n]
$T (N) = T (N - 1) + 1$
分治：return sum(A, lo, mi) + sum(A, mi+1, hi)
$T (N) = 2 * T (N / 2) + O (1), T (N) = O (N)$

向量

线性表中的元素放在连续的存储空间中；可以用一维数组表示
与数组的区别：泛化(支持更多数据类型可以非基本) ，自带操作接口

自动扩充

size大于capacity时，自动扩充到现在capacity的两倍
相比数组来说，是动态空间管理实现比较复杂但是避免了上溢空间浪费等问题

扩容(分摊时间复杂度也就是平均每次操作的时间复杂度)时间复杂度分析：
将所有的操作中用于数组扩容的时间累加起来，除以n，只要n足够大，这一事件就是用于扩容处理的分摊时间成本
每次扩容一倍 $O (2)$
$\frac{\sum_{n=i}^{log_2N}2^n}{N}=O(2)$
每次扩充固定容量 $O (N / 2 X)$
$\frac{x\sum_{i=1}^{i=N/x}i}{N}=O(N)$

排序

归并排序
$T(N)=2*T(\frac{N}{2})+O(N)$
$T (N) = O (N l o g (N))$
最佳最差平均的时间复杂度都是一样的 不受输入数据的影响

void merge_sort_recursive(int arr[], int reg[], int start, int end) {
    if (start >= end)
        return;
    int len = end - start, mid = (len >> 1) + start;
    //不能整除则向上取整
    int start1 = start, end1 = mid;
    int start2 = mid + 1, end2 = end;
    merge_sort_recursive(arr, reg, start1, end1);
    merge_sort_recursive(arr, reg, start2, end2);
    //为避免传参的麻烦直接在此处对有序序列进行排序
    int k = start;
    while (start1 <= end1 && start2 <= end2)
        reg[k++] = arr[start1] < arr[start2] ? arr[start1++] : arr[start2++];
    while (start1 <= end1)
        reg[k++] = arr[start1++];
    while (start2 <= end2)
        reg[k++] = arr[start2++];
    for (k = start; k <= end; k++)
        arr[k] = reg[k];
}

需要注意的细节：
start2=mid+1所以两个序列左右都是闭区间；因此在最前面需要判断对于只有一个元素的序列直接返回，不做处理。

唯一化

对于无需序列： $O(N^2)$
对有序向量的唯一化优化：
从前向后遍历，找到与上一个不相同的往前放 $O (N)$

查找

直接查找最好 $O (1)$ 最差 $O (N)$ ，平均 $O (N)$
(插入删除的也相同 )
二分查找为 $O (l o g (N))$

// a[],int e
int search(int e,int begin,int end)
{
    int mid=(begin+end)>>1;
    if(e>a[mid])     search(mid+1,end);
    else if(e==a[mid]) return mid;
    else    search(begin ,mid-1);
}

平均查找长度(ASL)：平均查找表中的元素个数
$ASL=\sum p_i c_i$
顺序查找：成功 $\frac{N-1}{2}$ ;失败 $O (N)$
二分查找：成功 $\frac{\sum_{i=1}^i=log_2(N+1)2^{i-1}*i}{N}=log_2(N+1)-1$
查找不成功要看叶子节点伸出的外部节点，认为其是等概率的，然后再求平均。

对二分查找的优化：
插值或者斐波那契都是变化其分点的位置

列表

存储与构建

列表是按照链式结构实现存储，数据元素的物理存储位置可以随便，不一定要线性
顺序存储结构是静态空间的管理策略，通过链式存储结构实现动态空间管理。
但是在访问上需要通过局部邻域的关系去访问，时间复杂度为 $O (n)$ ；顺序存储空间可以通过下标去直接访问（随机存取）
(因此链表无法根据秩去直接访问无法采取二分查找)
一个地址需要4个字节去存储