第二章数据结构(二)

一只积极向上的小咸鱼

已于 2022-08-07 20:26:41 修改

阅读量232

点赞数

分类专栏： Acwing 基础算法文章标签：数据结构 c++ 图论

于 2022-08-07 12:02:02 首次发布

本文链接：https://blog.csdn.net/m0_49448331/article/details/126208950

版权

Acwing 基础算法专栏收录该内容

9 篇文章 1 订阅

订阅专栏

本文详细介绍了数据结构中的Trie树、并查集和堆，并通过实例展示了它们在字符串集合存储、集合合并查询及最小值查找等场景中的应用。内容涵盖Trie树的插入与查询操作、并查集的路径压缩与集合合并、堆的插入、删除及最小值获取等基础操作。同时，文章提供了完整的C++代码实现，帮助读者深入理解这些数据结构的实现细节。

摘要由CSDN通过智能技术生成

Trie树

Tire：高效地存储和查找字符串集合的数据结构

存储

如果没有就创建。

对单词结尾进行标记，表示以当前节点结尾的地方存在一个单词

维护一个字符串集合，支持两种操作：

I x 向集合中插入一个字符串 x；
Q x 询问一个字符串在集合中出现了多少次。
共有 N 个操作，输入的字符串总长度不超过 105，字符串仅包含小写英文字母。

输入格式
第一行包含整数 N，表示操作数。

接下来 N 行，每行包含一个操作指令，指令为 I x 或 Q x 中的一种。

输出格式
对于每个询问指令 Q x，都要输出一个整数作为结果，表示 x 在集合中出现的次数。

每个结果占一行。

数据范围
1≤N≤2∗104
输入样例：
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例：
1
0
1

#include <iostream>
using namespace std;

const int N = 100010;
/*
下标为x的点，x的所有儿子存在son[x][i]中
cnt[x] 以x结尾的单词有多少个
idx 当前用到的哪一个下标 新插入一个节点++idx
idx： 0,1,2,3
*/
//第一个索引代表节点，26设置是因为最多有26个字母，每个节点最多有26个子节点
int son[N][26];
//单词结尾的标志，输入查询最多为N
int cnt[N];

int idx; //代表节点的标号，即代表节点。每个节点的idx唯一,下标是0的点既是空节点又是根节点
char str[N];
void insert(char str[])
{
    int p = 0;
    for(int i = 0;str[i];i++)  //CPP中字符串结尾是0 
    {
        //映射
        int u = str[i] - 'a';
        if(!son[p][u]) son[p][u] = ++idx;
        p = son[p][u];
    }
    //以该节点结尾的单词个数增加一个
    cnt[p]++;
}

int query(char str[])
{
    int p = 0;
    for(int i = 0;str[i];i++)
    {
        int u = str[i] - 'a';
        //不存在子节点
        if(!son[p][u]) return 0;
        p = son[p][u];
    }
    return cnt[p];
}

int main()
{
    int n;
    scanf("%d",&n);
    while(n--)
    {
        char op[2];
        scanf("%s%s",op,str);
        if(op[0] == 'I') insert(str);
        else printf("%d\n",query(str));
    }
    return 0;
}

并查集

常规例题

作用：【学数据结构必须清楚该数据结构的用途】

将两个集合合并
询问两个元素是否在一个集合当中

每一个集合的编号是根节点的编号，每一个点存储他的父节点编号。

并查集维护多余信息

连通块：可以从A走到B

给定一个包含 n 个点（编号为 1∼n）的无向图，初始时图中没有边。

现在要进行 m 个操作，操作共有三种：

C a b，在点 a 和点 b 之间连一条边，a 和 b 可能相等；
Q1 a b，询问点 a 和点 b 是否在同一个连通块中，a 和 b 可能相等；
Q2 a，询问点 a 所在连通块中点的数量；
输入格式
第一行输入整数 n 和 m。

接下来 m 行，每行包含一个操作指令，指令为 C a b，Q1 a b 或 Q2 a 中的一种。

输出格式
对于每个询问指令 Q1 a b，如果 a 和 b 在同一个连通块中，则输出 Yes，否则输出 No。

对于每个询问指令 Q2 a，输出一个整数表示点 a 所在连通块中点的数量

每个结果占一行。

数据范围
1≤n,m≤105
输入样例：
5 5
C 1 2
Q1 1 2
Q2 1
C 2 5
Q2 5
输出样例：
Yes
2
3

样例示意图

用集合代表连通块，在两个点添加边的作用为将两个集合合并。相对第一题，增加了一步为统计集合中点的数量

用size维护集合中点的数量，只有根节点有意义，添加集合时可以使用以下方法更新size

#include <stdio.h>
using namespace std;
const int N =100010;
int n,m;
int p[N]；
int size[N];//size用于存储集合的大小，规定只有根节点的size有意义
int find(int x)
{
    if(p[x] != x) p[x] = find(p[x]);
    return p[x];
}

int main()
{
    scanf("%d%d",&n,&m);
    for(int i = 1;i<=n;i++) 
    {
        p[i] = i;
        //初始化，一开始每个集合中有一个点，size均为1
        size[i] = 1; 
    }
    while(m--)
    {
        char op[5];
        int a,b ;
        scanf("%s",op);
        if(op[0] == 'C') 
        {
            scanf("%d%d",&a,&b);
            //特判：如果A与B已经在一个集合中，直接continue，后面操作不再进行
            if(find(a) == find(b)) continue;
			/*
			注意：以下两个语句的顺序不能颠倒：
			1.先进行size数组的更新
			2.再将两个集合合并
			如果先合并，会将一个集合的size覆盖导致没有一个集合没有意义
            */
            size[find(b)] += size[find(a)];
            p[find(a)] = find(b);              
        }
        else if(op[1] == '1')
        {
            scanf("%d%d",&a,&b);
            if(find(a) == find(b) ) puts("Yes");
            else puts("No");
        }
        else
        {
            scanf("%d",&a);
            printf("%d\n",size[find(a)]);
        }
        
    }
    return 0;
}

堆

性质

堆是一个完全二叉树：

除了最后一层节点以外，上面所有结点都是满的
最后一层节点从左到右排列

小根堆：每个节点都小于等于左右儿子，跟节点是整棵树的最小值

存储

用一维数组存储

下标从1开始，从0开始不太方便

基础操作

down

将节点向下移动

基本逻辑：如果把某一点值变大了，就需要将这个节点向下移动，越大的数越向下沉

递归的过程

up

将节点向上移

基本逻辑：如果把某一点值变小了，就需要将这个节点向上移动，越小的数越向上浮

操作

插入一个数

在最后位置插入新的数，将这个数向上移动
```
heap[++size] = x; up(size);
```
求集合中最小值
```
heap[1]
```
删除最小

把最后一个元素覆盖堆顶元素，size–，再把堆顶down一遍

原因：

一维数组删除头结点比较困难，但删除尾节点比较方便[size–]
```
heap[1] = heap[size];size--;down(1)
```
删除任意元素[类似删除最小]

heap值3种情况：不变；向下走；向上走

因此只会选择一个
```
heap[k] = heap[size];size--;down(k);up(k);
```
修改任意值
```
heap[k] = x;down(k);up(k);s
```

时间复杂度：

求最小值：O(1)

插入与删除： O(logN)

建立堆：

存在O(n)的建立堆的方式：从n/2开始down

例题

输入一个长度为 n 的整数数列，从小到大输出前 m 小的数。

输入格式
第一行包含整数 n 和 m。

第二行包含 n 个整数，表示整数数列。

输出格式
共一行，包含 m 个整数，表示整数数列中前 m 小的数。

数据范围
1≤m≤n≤105，
1≤数列中元素≤109
输入样例：
5 3
4 5 1 3 2
输出样例：
1 2 3

#include <stdio.h>
#include <algorithm>

using namespace std;

const int N = 100010;

int n,m;
//h代表heap
int h[N],hsize;

void down(int u)
{
    //t代表3个点中的最小值
    int t  = u;
    if(u * 2 <= hsize && h[u*2] < h[t] ) t = u*2;
    if(u *2 + 1 <= hsize && h[u*2 + 1] < h[t]) t = u*2 +1;
    //最后，u存储的为三个点中最小值的节点编号
    if(u != t)
    {
        swap(h[u],h[t]);
        //最后进行递归处理,当节点没有左右儿子时或者根节点比左右儿子小时，结束递归
        down(t);
    }
}

//up只需要与父节点比较,不需要新加变量，down操作需要与左右儿子节点比较
void up(int u)
{
    //如果存在根节点[u>2]并且根节点的值大于儿子节点
    //终止条件为到头或者上面形成小队
    while(u / 2 && h[u/2] > h[u])
    {
        swap(h[u/2],h[u]);
        u /=2;
    }
}

int main()
{
    scanf("%d%d",&n,&m);
    for(int i = 1;i <= n; i++) scanf("%d",&h[i]);
    //初始化
    hsize  = n;
    // 索引从n/2 ~ 1可以使用这种方式；不是到0
    for(int i  = n/2;i;i--) down(i);
    while(m--)
    {
        printf("%d ",h[1]);
        h[1] = h[hsize];
        hsize--;
        down(1);
    }
    return 0;
}

维护一个集合，初始时集合为空，支持如下几种操作：

I x，插入一个数 x；
PM，输出当前集合中的最小值；
DM，删除当前集合中的最小值（数据保证此时的最小值唯一）；
D k，删除第 k 个插入的数；
C k x，修改第 k 个插入的数，将其变为 x；
现在要进行 N 次操作，对于所有第 2 个操作，输出当前集合的最小值。

输入格式
第一行包含整数 N。

接下来 N 行，每行包含一个操作指令，操作指令为 I x，PM，DM，D k 或 C k x 中的一种。

输出格式
对于每个输出指令 PM，输出一个结果，表示当前集合中的最小值。

每个结果占一行。

数据范围
1≤N≤105
−109≤x≤109
数据保证合法。

输入样例：
8
I -10
PM
I -10
D 1
C 2 8
I 6
PM
DM
输出样例：
-10
6

麻烦在于删除第k个插入的数，因此插入与删除时需要快速找到第k个数是啥，因此需要额外开两个数组存储[p–下标，h–堆]

名称	含义	作用
ph[k]	第k个插入数的在堆中下标是什么	寻找第k个插入的点
hp[k]	堆里的点是第几个插入的点	交换两个点后需要交换ph，需要知道点是第几个插入的。服务于ph数组

#include <stdio.h>
#include <algorithm>
#include <string.h>

using namespace std;

const int N = 100010;


//h代表heap
int h[N],ph[N],hp[N],hsize;
char op[5];

//交换不能是仅仅交换两个值，需要全新的交换操作，需要定义函数
void heap_swap(int a,int b)
{
    swap(ph[hp[a]],ph[hp[b]]);
    swap(hp[a],hp[b]);
    swap(h[a],h[b]);
}

void down(int u)
{
    //t代表3个点中的最小值
    int t  = u;
    if(u * 2 <= hsize && h[u*2] < h[t] ) t = u*2;
    if(u *2 + 1 <= hsize && h[u*2 + 1] < h[t]) t = u*2 +1;
    //最后，u存储的为三个点中最小值的节点编号
    if(u != t)
    {
        heap_swap(u,t);
        //最后进行递归处理,当节点没有左右儿子时或者根节点比左右儿子小时，结束递归
        down(t);
    }
}

//up只需要与父节点比较,不需要新加变量，down操作需要与左右儿子节点比较
void up(int u)
{
    //如果存在根节点[u>2]并且根节点的值大于儿子节点
    //终止条件为到头或者上面形成小队
    while(u / 2 && h[u/2] > h[u])
    {
        heap_swap(u/2,u);
        u /=2;
    }
}

int main()
{
    int n,m = 0;
    scanf("%d",&n);
    while(n--)
    {
        int k,x;
        scanf("%s",op);
        if(!strcmp(op,"I"))
        {
            scanf("%d",&x);
            hsize++;
            m++;
            ph[m] = hsize;
            hp[hsize] = m;
            h[hsize] = x;
            up(hsize);
        }
        else if(!strcmp(op,"PM")) printf("%d\n",h[1]);
        else if(!strcmp(op,"DM"))
        {
            heap_swap(1,hsize);
            hsize--;
            down(1);
        }
        else if(!strcmp(op,"D"))
        {
            scanf("%d",&k);
            //用k来存储第k个点对应的下标，方便后面使用down(k),up(k);
            k = ph[k];
            heap_swap(k,hsize);
            hsize--;
            down(k),up(k);
        }
        //修改第k个插入的数
        else
        {
            scanf("%d%d",&k,&x);
            k = ph[k];
            h[k] = x;
            down(k),up(k);
        }
    }

    return 0;
}

此处为什么使用strcmp函数而不是像之前使用op[idx]进行字符串对比

因为输入为"I" DM" “PM” “D” “C” ，不容易根据字符串的某个索引区分不同的输入。因此采用更为精确的strcmp函数

/*
功能：
    函数strcmp的功能是比较两个字符串的大小。
    把字符串str1和str2从首字符开始逐个字符的进行比较，直到某个字符不相同或者其中一个字符串比较完毕才停止比较。字符的比较为ASCII码的比较。
输入:
    两个字符串
返回值：
    若字符串1大于字符串2，返回结果大于零；
    若字符串1小于字符串2，返回结果小于零；
    若字符串1等于字符串2，返回结果等于零
*/
int strcmp(char *str1,char * str2);