你想知道的深度优先与广度优先算法(搜索引擎抓取)

前言:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
   *搜索引擎主要的抓取策略就有深度优先搜索与广度优先搜索。这里我们来介绍数据结构图论的这部分知识。 *

一、深度优先搜索

   (Depth First Search,DFS)遍历类似于树的先序遍历,是树的先序遍历的推广。对于一个连通图,深度优先搜索遍历的过程如下。
(1)从图中某个定点v除法,访问v。
(2)找出刚访问过的定点的第一个未被访问的邻接点,访问该顶点。以该顶点为新顶点,重复此步骤,直至刚访问过的定点没有未被访问的邻接点为止。
(3)返回前一个访问过的且仍有未被访问的邻接点的定点,找出该顶点的下一个未被访问的邻接点,访问该顶点。
(4)重复步骤(2)(3),直至图中所有顶点都被访问过,搜索结束。

1.//算法 深度优先搜索遍历连通图的递归算法

//算法 深度优先搜索遍历连通图的递归算法

#include <iostream>
using namespace std;

#define MVNum 100									//最大顶点数
typedef char VerTexType;							//假设顶点的数据类型为字符型 
typedef int ArcType;                 				//假设边的权值类型为整型 

typedef struct{ 
	VerTexType vexs[MVNum];            				//顶点表 
	ArcType arcs[MVNum][MVNum];      				//邻接矩阵 
	int vexnum,arcnum;                				//图的当前点数和边数 
}Graph;
 
bool visited[MVNum];           					//访问标志数组,其初值为"false" 
int FirstAdjVex(Graph G , int v);				//返回v的第一个邻接点
int NextAdjVex(Graph G , int v , int w);		//返回v相对于w的下一个邻接点

int LocateVex(Graph G , VerTexType v){
	//确定点v在G中的位置
	for(int i = 0; i < G.vexnum; ++i)
		if(G.vexs[i] == v)
			return i;
		return -1;
}//LocateVex

void CreateUDN(Graph &G){ 
    //采用邻接矩阵表示法,创建无向网G 
	int i , j , k;
	cout <<"请输入总顶点数,总边数 , 以空格隔开:";
    cin >> G.vexnum >> G.arcnum;						 //输入总顶点数,总边数
	cout << endl;

	cout << "输入点的名称,如 a:" << endl;

    for(i = 0; i < G.vexnum; ++i){   
		cout << "请输入第" << (i+1) << "个点的名称:";
		cin >> G.vexs[i];                        		 //依次输入点的信息 
	}
	cout << endl;

    for(i = 0; i < G.vexnum; ++i)                		 //初始化邻接矩阵,边的权值均置为极大值MaxInt 
		for(j = 0; j < G.vexnum; ++j)   
			G.arcs[i][j] = 0;  
	cout << "输入边依附的顶点,如:a b" << endl;
	for(k = 0; k < G.arcnum;++k){						 //构造邻接矩阵 
		VerTexType v1 , v2;
		cout << "请输入第" << (k + 1) << "条边依附的顶点:";
		cin >> v1 >> v2;								 //输入一条边依附的顶点及权值
		i = LocateVex(G, v1);  j = LocateVex(G, v2);	 //确定v1和v2在G中的位置,即顶点数组的下标 
		G.arcs[j][i] = G.arcs[i][j] = 1;                 //置<v1, v2>的对称边<v2, v1>的权值为w 
	}//for
}//CreateUDN 

void DFS(Graph G, int v){        			//从第v个顶点出发递归地深度优先遍历图G 
	cout << G.vexs[v] << "    ";  visited[v] = true;   	//访问第v个顶点,并置访问标志数组相应分量值为true 
	int w;
	for(w = FirstAdjVex(G, v);  w >= 0;  w = NextAdjVex(G, v, w))  
		//依次检查v的所有邻接点w ,FirstAdjVex(G, v)表示v的第一个邻接点 
		//NextAdjVex(G, v, w)表示v相对于w的下一个邻接点,w≥0表示存在邻接点 
		if(!visited[w]) DFS(G, w);    					//对v的尚未访问的邻接顶点w递归调用DFS 
}//DFS

int FirstAdjVex(Graph G , int v){
	int i;
	for(i = 0 ; i < G.vexnum ; ++i){
		if(G.arcs[v][i] == 1 && visited[i] == false)
			return i;
	}
	return -1;
}//FirstAdjVex

int NextAdjVex(Graph G , int v , int w){
	int i;
	for(i = w ; i < G.vexnum ; ++i){
		if(G.arcs[v][i] == 1 && visited[i] == false)
			return i;
	}
	return -1;
}//NextAdjVex

int main(){
	cout << "************深度优先搜索遍历连通图的递归算法**************" << endl << endl;
	Graph G;
	CreateUDN(G);
	cout << endl;
	cout << "无向连通图G创建完成!" << endl << endl;
	
	cout << "请输入遍历连通图的起始点:";
	VerTexType c;
	cin >> c;

	int i;
	for(i = 0 ; i < G.vexnum ; ++i){
		if(c == G.vexs[i])
			break;
	}
	cout << endl;
	while(i >= G.vexnum){
		cout << "该点不存在,请重新输入!" << endl;
		cout << "请输入遍历连通图的起始点:";
		cin >> c;
		for(i = 0 ; i < G.vexnum ; ++i){
			if(c == G.vexs[i])
				break;
		}
	}
	cout << "深度优先搜索遍历连通图结果:" << endl;
	DFS(G , i);

	cout <<endl;
	return 0;
}//main

2.//算法 深度优先搜索遍历非连通图

//算法 深度优先搜索遍历非连通图

#include <iostream>
using namespace std;

#define MVNum 100								//最大顶点数
typedef char VerTexType;						//假设顶点的数据类型为字符型 
typedef int ArcType;                 			//假设边的权值类型为整型 
	
//-------------图的邻接矩阵-----------------
typedef struct{ 
	VerTexType vexs[MVNum];            			//顶点表 
	ArcType arcs[MVNum][MVNum];      			//邻接矩阵 
	int vexnum,arcnum;                			//图的当前点数和边数 
}Graph;

bool visited[MVNum];           					//访问标志数组,其初值为"false" 
int FirstAdjVex(Graph G , int v);				//返回v的第一个邻接点
int NextAdjVex(Graph G , int v , int w);		//返回v相对于w的下一个邻接点

int LocateVex(Graph G , VerTexType v){
	//确定点v在G中的位置
	for(int i = 0; i < G.vexnum; ++i)
		if(G.vexs[i] == v)
			return i;
		return -1;
}//LocateVex

void CreateUDN(Graph &G){ 
    //采用邻接矩阵表示法,创建无向网G 
	int i , j , k;
	cout <<"请输入总顶点数,总边数,以空格隔开:";
    cin >> G.vexnum >> G.arcnum;								//输入总顶点数,总边数
	cout << endl;	
	
	cout << "输入点的名称,如a" << endl;
    for(i = 0; i < G.vexnum; ++i){   
		cout << "请输入第" << (i+1) << "个点的名称:";
		cin >> G.vexs[i];                        				//依次输入点的信息 
	}
	cout << endl;
    for(i = 0; i < G.vexnum; ++i)                				//初始化邻接矩阵,边的权值均置为极大值MaxInt 
		for(j = 0; j < G.vexnum; ++j)   
			G.arcs[i][j] = 0;  
	cout << "输入边依附的顶点,如a b" << endl;
	for(k = 0; k < G.arcnum;++k){								//构造邻接矩阵 
		VerTexType v1 , v2;
		cout << "请输入第" << (k + 1) << "条边依附的顶点:";
		cin >> v1 >> v2;										//输入一条边依附的顶点及权值
		i = LocateVex(G, v1);  j = LocateVex(G, v2);			//确定v1和v2在G中的位置,即顶点数组的下标 
		G.arcs[j][i] = G.arcs[i][j] = 1;						//置<v1, v2>的对称边<v2, v1>的权值为w 
	}//for
}//CreateUDN 

void DFS(Graph G, int v){        								
	//从第v个顶点出发递归地深度优先遍历图G 
	cout << G.vexs[v] << "    ";  visited[v] = true;    		//访问第v个顶点,并置访问标志数组相应分量值为true 
	int w;
	for(w = FirstAdjVex(G, v);  w >= 0;  w = NextAdjVex(G, v, w))  
		//依次检查v的所有邻接点w ,FirstAdjVex(G, v)表示v的第一个邻接点 
		//NextAdjVex(G, v, w)表示v相对于w的下一个邻接点,w≥0表示存在邻接点 
		if(!visited[w]) DFS(G, w);    							//对v的尚未访问的邻接顶点w递归调用DFS 
}//DFS

void DFSTraverse(Graph G){ 
	//对非连通图G做深度优先遍历 
	int v;
	for(v = 0; v < G.vexnum; ++v)  visited[v] = false;			//访问标志数组初始化 
	for(v = 0; v < G.vexnum; ++v)                    			//循环调用算法6.3 
        if(!visited[v])  DFS(G, v);                    			//对尚未访问的顶点调用DFS 
}//DFSTraverse 

int FirstAdjVex(Graph G , int v){
	//返回v的第一个邻接点
	int i;
	for(i = 0 ; i < G.vexnum ; ++i){
		if(G.arcs[v][i] == 1 && visited[i] == false)
			return i;
	}
	return -1;
}//FirstAdjVex

int NextAdjVex(Graph G , int v , int w){
	//返回v相对于w的下一个邻接点
	int i;
	for(i = w ; i < G.vexnum ; ++i){
		if(G.arcs[v][i] == 1 && visited[i] == false)
			return i;
	}
	return -1;
}//NextAdjVex

int main(){
	cout << "************深度优先搜索遍历非连通图**************" << endl << endl;
	Graph G;
	CreateUDN(G);
	cout << endl;
	cout << "无向图G创建完成!" << endl << endl;
	
	cout << "深度优先搜索遍历非连通图结果:" << endl;
	DFSTraverse(G);

	cout <<endl;
	return 0;
}//main

二、广度优先搜索

   (Breadth First Search,BFS)遍历类似于树的按层次遍历的过程。广度优先搜索遍历过程如下。
(1)从图中某个定点v出发,访问v。
(2)依次访问v的各个未曾访问过的邻接点。
(3)分别从这些邻接点出发依次访问它们的邻接点,并使“先被访问的定点的邻接点”先于“后被访问的顶点的邻接点”被访问。重复步骤(3),直至图中所有已被访问的顶点的邻接点都被访问到。

//算法 广度优先搜索遍历连通图

//算法 广度优先搜索遍历连通图

#include <iostream>
using namespace std;

#define MVNum 100                       	//最大顶点数
#define MAXQSIZE 100						//最大队列长度
						
typedef char VerTexType;              		//假设顶点的数据类型为字符型
typedef int ArcType;                  		//假设边的权值类型为整型
bool visited[MVNum];           				//访问标志数组,其初值为"false" 

//-----图的邻接矩阵存储表示----- 
typedef struct{ 
	VerTexType vexs[MVNum];            		//顶点表
	ArcType arcs[MVNum][MVNum];      		//邻接矩阵
	int vexnum,arcnum;                		//图的当前点数和边数
}Graph;

//----队列的定义及操作--------
typedef struct{
	ArcType *base;							//初始化的动态分配存储空间
	int front;								//头指针,若队列不空,指向队头元素
	int rear;								//尾指针,若队列不空,指向队尾元素的下一个位置
}sqQueue;

void InitQueue(sqQueue &Q){
	//构造一个空队列Q
	Q.base = new ArcType[MAXQSIZE];
	if(!Q.base)     exit(1);				//存储分配失败
	Q.front = Q.rear = 0;
}//InitQueue

void EnQueue(sqQueue &Q, ArcType e){
	//插入元素e为Q的新的队尾元素
	if((Q.rear + 1) % MAXQSIZE == Q.front)
		return;
	Q.base[Q.rear] = e;
	Q.rear = (Q.rear + 1) % MAXQSIZE;
}//EnQueue

bool QueueEmpty(sqQueue Q){
	//判断是否为空队
	if(Q.rear == Q.front)
		return true;
	return false;
}//QueueEmpty

void DeQueue(sqQueue &Q, ArcType &u){
	//队头元素出队并置为u 
	u = Q.base[Q.front];
	Q.front = (Q.front + 1) % MAXQSIZE;
}//DeQueue   								
//--------------------------------------------------

int LocateVex(Graph G , VerTexType v){
	//确定点v在G中的位置
	for(int i = 0; i < G.vexnum; ++i)
		if(G.vexs[i] == v)
			return i;
		return -1;
}//LocateVex

void CreateUDN(Graph &G){ 
    //采用邻接矩阵表示法,创建无向网G 
	int i , j , k;
	cout <<"请输入总顶点数,总边数,以空格隔开:";
    cin >> G.vexnum >> G.arcnum;							//输入总顶点数,总边数
	cout << endl;
	cout << "输入点的名称,如a" << endl;
    for(i = 0; i < G.vexnum; ++i){   
		cout << "请输入第" << (i+1) << "个点的名称:";
		cin >> G.vexs[i];                        			//依次输入点的信息 
	}
	cout << endl;
    for(i = 0; i < G.vexnum; ++i)                			//初始化邻接矩阵,边的权值均置为极大值MaxInt 
		for(j = 0; j < G.vexnum; ++j)   
			G.arcs[i][j] = 0; 
	cout << "输入边依附的顶点,如a b" << endl;
	for(k = 0; k < G.arcnum;++k){							//构造邻接矩阵 
		VerTexType v1 , v2;
		cout << "请输入第" << (k + 1) << "条边依附的顶点:";
		cin >> v1 >> v2;									//输入一条边依附的顶点
		i = LocateVex(G, v1);  j = LocateVex(G, v2);		//确定v1和v2在G中的位置,即顶点数组的下标 
		G.arcs[i][j] = 1;									//边<v1, v2>的权值置为w 
		G.arcs[j][i] = G.arcs[i][j];						//置<v1, v2>的对称边<v2, v1>的权值为w 
	}//for 
}//CreateUDN

int FirstAdjVex(Graph G , int v){
	//返回v的第一个邻接点
	int i;
	for(i = 0 ; i < G.vexnum ; ++i){
		if(G.arcs[v][i] == 1 && visited[i] == false)
			return i;
	}
	return -1;
}//FirstAdjVex

int NextAdjVex(Graph G , int u , int w){
	//返回v相对于w的下一个邻接点
	int i;
	for(i = w ; i < G.vexnum ; ++i){
		if(G.arcs[u][i] == 1 && visited[i] == false)
			return i;
	}
	return -1;
}//NextAdjVex

void BFS (Graph G, int v){ 
    //按广度优先非递归遍历连通图G 
	sqQueue Q;
	ArcType u;
	ArcType w;

    cout << G.vexs[v] << "  ";    visited[v] = true;     						//访问第v个顶点,并置访问标志数组相应分量值为true 
    InitQueue(Q);              													//辅助队列Q初始化,置空         
    EnQueue(Q, v);            													//v进队 
    while(!QueueEmpty(Q)){   													//队列非空 
		DeQueue(Q, u);       													//队头元素出队并置为u
		for(w = FirstAdjVex(G, u); w >= 0; w = NextAdjVex(G, u, w)){
			//依次检查u的所有邻接点w ,FirstAdjVex(G, u)表示u的第一个邻接点 
			//NextAdjVex(G, u, w)表示u相对于w的下一个邻接点,w≥0表示存在邻接点 
			if(!visited[w]){	           										//w为u的尚未访问的邻接顶点 
				cout << G.vexs[w] << "  ";   visited[w] = true;					//访问w,并置访问标志数组相应分量值为true 
				EnQueue(Q, w);													//w进队 
			}//if 
		}//for
    }//while 
}//BFS 

int main(){
	cout << "************广度优先搜索遍历连通图**************" << endl << endl;
	Graph G;
	CreateUDN(G);
	cout << endl;
	cout << "无向连通图G创建完成!" << endl << endl;
	
	cout << "请输入遍历连通图的起始点:";
	VerTexType c;
	cin >> c;
	
	int i;
	for(i = 0 ; i < G.vexnum ; ++i){
		if(c == G.vexs[i])
			break;
	}
	cout << endl;
	while(i >= G.vexnum){
		cout << "该点不存在,请重新输入!" << endl;
		cout << "请输入遍历连通图的起始点:";
		cin >> c;
		for(i = 0 ; i < G.vexnum ; ++i){
			if(c == G.vexs[i])
				break;
		}
	}
	cout << "深度优先搜索遍历连通图结果:" << endl;
	BFS(G , i);
	
	cout <<endl;
	return 0;
}//main

后记:

    学习深度优先搜索和广度优先搜索是很重要的,后面会讲解最小生成树的普里姆算法克鲁斯卡尔算法,还有最短路径的迪杰斯科拉弗洛伊德算法。
有更好的讲解可以推荐哦,谢谢。

  • 5
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

threecat.up

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值