数据结构 图

树是无环连通图,是一种特殊的图。

分类

图分为有向图[边是有方向的]和无向图[边是无方向的]。

无向图(a—b),建立两条有向图(a—>b,b—>a),无向图是一种特殊的有向图。

存储有向图

邻接矩阵 ——用于存储比较稠密的图【O(n^2)】

开一个二维数组,g[a,b],a—>b;如果有权重,存权重,如果没有权重,就是布尔值;不能存储重边。

邻接表

n个点,每个点都有一个单链表,每个点的单链表存储该点可以到达的点,单链表内部点的顺序不重要。

//插入a—>b的边,在a所对应的单链表中插入b

void add(int a, int b) {

e[idx] = b;

ne[idx] = h[a];

h[a] = idx++;

}

有向图的遍历

宽度优先遍历

一层一层搜索

框架

queue <—— 将起始状态插入队列中,即将1号点插入队列

while (queue 不空){

t 每次取队头元素

拓展 t 所有能到的点 x

if(x 未被遍历){

 queue <——x 将 x 入队

d[x]=d[t]+1

}

}

例题——图中点的层次

给定一个n个点m条边的有向图,图中可能存在重边和自环。

所有边的长度都是1,点的编号为1~n。

请你求出1号点到n号点的最短距离,如果从1号点无法走到n号点,输出-1。

输入格式

第一行包含两个整数n和m。

接下来m行,每行包含两个整数a和b,表示存在一条从a走到b的长度为1的边。

输出格式

输出一个整数,表示1号点到n号点的最短距离。

数据范围

1≤n,m≤10^5

输入样例

4 5

1 2

2 3

3 4

1 3

1 4

输出样例

1

代码

#include<iostream>
#include<cstring>
using namespace std;
const int N = 100010;
int n, m;
int h[N], e[N], ne[N], idx;
int d[N], q[N];
void add(int a, int b) {//插入函数
	e[idx] = b;
	ne[idx] = h[a];
	h[a] = idx++;
}
int bfs() {
	int hh = 0, tt = 0;
	q[0] = 1;
	memset(d, -1, sizeof d);//初始化距离,-1代表未被初始化
	d[1] = 0;
	while (hh <= tt) {//判断队列是否为空
		int t = q[hh++];//取队头
		for (int i = h[t];i != -1;i = ne[i]) {//扩展队头
			int j = e[i];
			if (d[j] == -1) {
				d[j] = d[t] + 1;
				q[++tt] = j;
			}
		}
	}
	return d[n];
}
int main() {
	cin >> n >> m;
	memset(h, -1, sizeof h);//初始化表头
	for (int i = 0;i < m;i++) {
		int a, b;
		cin >> a >> b;
		add(a, b);
	}
	cout << bfs() << endl;
}

深度优先遍历

找到一个起点,然后从这个 起点开始,一条路走向黑

邻接表的深度优先遍历

主函数:

for(int i=0;i<n;i++) dfs(i); //枚举起点

dfs:

利用图中结点的编号进行搜索,e存图中结点的编号

int h[N], e[M], ne[M], idx;//h存n个链表的链表头,e存每个结点的值是多少,ne存每个结点的next值

bool st[N];

//树和图的深度优先搜索

void dfs(int u) {//u是当前dfs到的点

st[u] = true;//标记一下,已经被搜过了

for (int i = h[u];i != -1;i = ne[i]) {//遍历u的所有出边

int j = e[i];//链表中该点在图中的编号

if (!st[j])//如果j没有被搜过,那么就进行搜索

dfs(j);

}

例题——树的重心

给定一颗树,树中包含n个结点(编号1~n)和n-1条无向边【无向图】。

请你找到树的重心,并输出将重心删除后,剩余各个连通块中点数的最大值。

重心定义:重心是指树中的一个结点,如果将这个点删除后,剩余各个连通块中点数的最大值最小,那么这个节点被称为树的重心。

输入格式

第一行包含整数n,表示树的结点数。

接下来n-1行,每行包含两个整数a和b,表示点a和点b之间存在一条边。

输出格式

输出一个整数m,表示重心的所有的子树中最大的子树的结点数目。

数据范围

1≤n≤10^5

输入样例

9

1 2

1 7

1 4

2 8

2 5

4 3

3 9

4 6

输出样例

4

代码
#include<iostream>
#include<cstring>
using namespace std;
const int N = 100010, M = N * 2;
int n;
int h[N], e[M], ne[M], idx;//h存n个链表的链表头,e存每个结点的值是多少,ne存每个结点的next值
bool st[N];
int ans = N;//答案,存最小的最大值
//插入a—>b的边,在a所对应的单链表中插入b
void add(int a, int b) {
	e[idx] = b;
	ne[idx] = h[a];
	h[a] = idx++;
}
//树和图的深度优先搜索
int dfs(int u) {//u是当前dfs到的点,返回以u为根的子树中,点的数量【以u为根的子树的大小】
	st[u] = true;//标记一下,已经被搜过了
	int sum = 1, res = 0;//res存删去重心后,每一个连通块大小的最大值;sum存当前子树的大小
	for (int i = h[u];i != -1;i = ne[i]) {//遍历u的所有初边
		int j = e[i];//链表中该点在图中的编号
		if (!st[j]) {//如果j没有被搜过,那么就进行搜索
			int s = dfs(j);//当前子树的大小
			res = max(res, s);//当前子树是一个连通块,所以与之前连通块的最大值进行比较
			sum += s;//以u的子结点为根结点的子树是以u为根结点子树的一部分
		}
	}
	res = max(res, n - sum);
	ans = min(ans, res);
	return sum;
}
int main() {
	cin >> n;
	memset(h, -1, sizeof h);//邻接表初始化,头指向-1
	for (int i = 0;i < n - 1;i++) {
		int a, b;
		cin >> a >> b;
		add(a, b);
		add(b, a);
	}
	dfs(1);//可以从任意点开始搜
	cout << ans << endl;
	return 0;
}

特殊的图——树[无环连通图]

概念

在计算器科学中,树(英语:tree)是一种抽象数据类型或是实现这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>0)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。

结点

指树中的一个元素;

结点的度

指结点拥有的子树的个数,二叉树的度不大于2;

树的度

指树中的最大结点度数;

叶子

度为0的结点,也称为终端结点;

高度

叶子节点的高度为1,根节点高度最高;

根在第一层,以此类推;

特点

一个父结点可以有多个子结点,一个子结点只能有一个父结点,多个子结点对应一个父结点。

①每个节点有零个或多个子节点;

②没有父节点的节点称为根节点;

③每一个非根节点有且只有一个父节点;

④除了根节点外,每个子节点可以分为多个不相交的子树;

二叉树

概念

每个节点最多含有两个子树的树称为二叉树。(我们一般在书中试题中见到的树是二叉树,但并不意味着所有的树都是二叉树。)

性质

1:二叉树的第i层上至多有2^(i-1)个结点

2:深度为k的二叉树,至多有2^k-1个结点

满二叉树

除最后一层无任何子节点外,每一层上的所有节点都有两个子节点。也可以这样理解,除叶子节点外的所有节点均有两个子节点。节点数达到最大值,所有叶子节点必须在同一层上。

完全二叉树

若设二叉树的深度为h,除第h层外,其它各层 (1~(h-1)层) 的节点数都达到最大个数(即节点均满),第h层所有的节点都连续集中在最左边(虽然最下面一层节点不满,但是所有节点在左边连续排列,空位都在右边),这就是完全二叉树。

性质
  • 结点 i 的子结点为 2*i 和 2*i+1 (前提是都小于总结点数)
  • 结点 i 的父结点为 i/2
  • 如果n个节点的完全二叉树的节点按照层次并按从左到右的顺序从0开始编号:
    • 序号为0的节点是根
    • 对于 i>0,其父节点的编号为(i-1)/2
    • 若 2*i+1<n,其左子节点的序号为 2*i+1,否则没有左子节点
    • 若 2*i+2<n,其右子节点的序号为 2*i+2,否则没有右子节点

遍历

深度优先遍历

按照一条路径尽可能的向前探索,直至检查完一个叶节点。

先序和中序可以唯一确定一个树【在先序中找父结点,在中序确定位置,得到左子树和右子树】

中序和后序可以唯一确定一个树【在后序中找父结点,在中序确定位置,得到左子树和右子树】

先序和后序不能唯一确定一个树【不能确定左子树和右子树的情况】

这三种遍历方法只是访问结点的时机不同,访问结点的路径都是一样的,时间和空间复杂度皆为O(n)

先序 根->左子树->右子树

父 左->右

先输出父节点,然后从左到右输出子节点

中序 左子树->根->右子树

先输出左节点,然后输出父节点,最后输出右节点

后序 左子树->右子树->根

先输出左节点,然后输出右节点,最后输出根节点

宽度优先搜索

在所有路径上齐头并进,按照路径长度由近到远访问节点,即按照二叉树的层数逐层访问树中的节点。

例题

先序:10 6 5 2 7 14 18 17 19

中序:2 5 6 7 10 14 17 18 19

后序:2 5 7 6 17 19 18 14 10

层次:10 6 14 5 7 18 2 17 19

作用

高效地存储和查找字符串集合的数据结构

适用于字符类型不多的字符串

如何存储字符串集合

有一个根节点,但该节点不存放数据。

存储的时候,应该在每个单词的结尾做标记,表示以该字母结尾的结点有一个单词。防止查找时,误以为该树存储了该字符串的子串。例如,树中存储“abcd”,若没有做标记,在查找“abc”是否在树中时,容易误以为该串存在,做标记后,查找到最后一个字符时,应该检测是否有结束标志,若没有则不存在。

如何查找

从根结点开始,挨个字符在对应层上寻找,若找到就继续向下一层找对应的字符,直到找到最后一个字符,观察字符上是否有结束标记,若有则说明该树上存储了该字符串,若是没有则说明该树上没有存储。若是直接没在该层上找到对应的字符,则说明该树上没有存储。

模板

数据含义

  • 整型 idx 用于给所有的存入树的字符进行编号,idx = 0 既表示根节点,又表示空节点(根节点不存数据)
  • 数组 cnt 用于表示以某个 idx 表示的字符为结尾的字符串的个数
  • 二维数组 son 用于存储每个 idx 对应的所有子节点,在 son 中的元素值为0,表示空节点

son 数组中元素的值代表该节点的子节点所在的位置,即 son 数组的高维度的编号。【son[a][b]=c表示该节点的子节点位于son[c]中】例如,先后存入 abc、abcd、abd、bcd。

为什么 son 不能存储每一层的字母,而是使用这种方式存储?

如果 son 存储每一层的字母,则分不清该字母是哪一个节点下的子节点了。

存储

每次存储字符串都是从根节点开始存储。当存储一个字符时,就应该给该字符编号,并根据编号跳到 son 中编号对应的那一层【将一维置为该编号】,该层存储该编号的所有子节点。当存储到字符串的最后一个字符时,应将该字符的编号作为 cnt 数组的下标,令该元素自身数据自增,表示以该编号所表示的字符为结尾的字符串个数+1,即表示该树上存储了多少个相同的字符串。

//存储
void insert(char str[]) {
    int p = 0;//根节点是0
    for (int i = 0;str[i];i++) {//从根节点开始,从前往后遍历
//因为字符串的最后一个字符是空字符,所以可以使用空字符判断该字符串是否到达末尾
        int u = str[i] - 'a';//将“a~z”映射成“0~25”
        if (!son[p][u]){//如果p这个节点不存在u这个儿子,就将其创造出来
            ++idx;
            son[p][u] = idx;//写成son[p][u]=++idx;是未定义行为,一个序列点对应两个副作用
        }
        p = son[p][u];
    }
    cnt[p]++;//表示以p点结尾的单词数多了一个
}

查找——返回字符串出现的次数

查找和存储思路一样,只是发现没存储该字符就直接返回0,表示没存储该字符串,存储该字符时才跳转。

int query(char str[]){
    int p=0;
    for(int i=0;str[i];i++){
        int u=str[i]-'a';
        if(!son[p][u])
            return 0;//不存在该字符串时直接返回0
        p=son[p][u];
    }
    return cnt[p];
}

输出——遍历输出树中所有的字符串

使用 dfs ,将当前的字符编号作为参数传入,表示要遍历该层26个字符,使用一个 string 存储当前遍历所组成的字符串,若遍历到某个字符存在树中,则将其放在 string 的末尾,并检测是否在以该字符编号为结尾的字符串,如果存在则输出。之后以其子节点层数编号作为新的参数执行 dfs 。当26个字符都没有存储在树中,则说明该路径上的所有的字符串遍历完成,应该进行回退,回退到上一层时,应将 string 的最后一个字符删去。之后遍历该层其他字符。

string temp;
void dfs(int p){
    for(int i=0;i<26;i++){
        if(son[p][i]){
            char tp[2]={'a'+i};
            temp.append(tp);
            if(cnt[son[p][i]]){
                cout<<temp<<endl;
            }
            dfs(son[p][i]);
            temp.pop_back();
        }
    }
}

例题——Trie字符串统计

维护一个字符串集合,支持两种操作:

“I x”向集合中插入一个字符串x;

“Q x”询问一个字符串在集合中出现了多少次。

共有N个操作,输入的字符串总长度不超过 10^5,字符串仅包含小写英文字母。

输入格式

第一行包含整数N,表示操作数。

接下来N行,每行包含一个操作指令,指令为”I x”或”Q x”中的一种。

输出格式

对于每个询问指令”Q x”,都要输出一个整数作为结果,表示x在集合中出现的次数。

每个结果占一行。

数据范围

1≤N≤2∗10^4

输入样例

5

I abc

Q abc

Q ab

I ab

Q ab

输出样例

1

0

1

#include<iostream>

using namespace std;

const int N = 100010;

int son[N][26], cnt[N], idx;//下标是0的点,既是根结点,又是空结点

//cnt 存以当前这个点结尾的单词有多少个

char str[N];

//存储

void insert(char str[]) {

int p = 0;

for (int i = 0;str[i];i++) {

int u = str[i] - 'a';

if (!son[p][u])//如果p这个结点不存在u这个儿子,就将其创造出来

son[p][u] = ++idx;

p = son[p][u];

}

cnt[p]++;

}

//查询

int query(char str[]) {

int p = 0;

for (int i = 0;str[i];i++) {

int u = str[i] - 'a';

if (!son[p][u])

return 0;

p = son[p][u];

}

return cnt[p];

}

int main() {

int n;

scanf("%d", &n);

while (n--) {

char op[2];

scanf("%s%s", op, str);

if (op[0] == 'I')

insert(str);

else

printf("%d\n", query(str));

}

return 0;

}

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

何hyy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值