查找算法思想及代码——C语言

最新推荐文章于 2024-02-27 01:53:39 发布

妖YOY

最新推荐文章于 2024-02-27 01:53:39 发布

阅读量1.7k

点赞数 2

分类专栏： C语言文章标签：算法 c语言数据结构

本文链接：https://blog.csdn.net/weixin_45788069/article/details/125480517

版权

C语言专栏收录该内容

10 篇文章 16 订阅

订阅专栏

数据结构中重要查找算法

前言
顺序查找法
折半查找法
分块查找法
树形查找法

前言

在这里插入图片描述
查找算法评价指标

查找长度——在查找运算中需要对比关键字的次数称为查找长度
平均查找长度（ALS）——所有查找过程中进行关键字的比较次数的平均值，有成功查找和失败下的查找长度

动态演示链接
在这里插入图片描述

对于哪个步骤不明白的可以在这里看下实际过程

顺序查找法

思想：从头到尾挨个找（反过来也行）
顺序查找时间复杂度： $O (n)$
代码：

#define MAXSIZE 100
typedef int ElemType;

typedef struct{				//查找表的数据结构(顺序表)
	ElemType *elem;			//动态数组基址
	int TableLen;			//表的长度
}SSTable;

//顺序查找
int Search_Seq(SSTable ST, ElemType key){
	int i;
	for(i=0; i<ST.TableLen && ST.elem[i] !=key; i++); 
	//查找成功,则返回元素下标;查找失败,则返回-1
	return i==ST.TableLen? -1 : i;
}

//“哨兵”
int Search_Seq_(SSTable ST, ElemType key){
	//数据从下标1开始存储 
	ST.elem[0]=key;		//“哨兵”
	int i;
	for(i=ST.TableLen; ST.elem[i]!=key; i--);		//从后往前找
	return i;		//查找成功,则返回元素下标;查找失败,则返回0
}

折半查找法

又称“二分查找”，仅适用于有序的顺序表
折半查找时间复杂度＝ $O(\log_2n)$
代码：

//结构体
typedef struct{
	ElemType *elem;
	int length;
}SSTable;

int Search_Bin(SSTable ST,ElemType key){
   // 在有序表ST中折半查找其关键字等于key的数据元素。
   // 若找到，则函数值为该元素在表中的位置，否则为-1。 
   int low=0,high=ST.length-1;							//置查找区间初值
   int  mid;
   while(low <= high){
	   mid = (low+high)/2;
      if(key==ST.elem[mid])
	  	return mid;      		//找到待查元素
      else if(key<ST.R[mid].key)
	  	high = mid -1;			//继续在前半部分查找
      else
	  	low = mid + 1;			//继续在后半部分查找
   }
   return -1;										//表中不存在待查元素
}// Search_Bin

在这里插入图片描述

分块查找法

思想：
索引表中记录每个分块的最大关键字、分块的区间；
先查索引表（顺序或折半），再对分块内进行顺序查找。
块内无序，块间有序
在这里插入图片描述

设索引查找和块内查找的平均查找长度分别为 $L_1$ 、 $L_s$ ,则分块查找的平均查找长度为 $ASL=L_1 + L_s$
$\frac{s^2+2s+n}{2s}，当s=\sqrt n时，ALS_{最小}=\sqrt{n}+1$

树形查找法

n个结点的二叉树最小高度为 $\lfloor{\log_2n}\rfloor + 1$ 或是 $\lceil{\log_2(n+1)}\rceil$
对具有n个关键字的树型结构，具有n+1个叶结点

二叉排序树，BST

粘一下定义，简单的说就是，左子树节点值 $\leq$ 根节点值 $\leq$ 右子树结点值
在这里插入图片描述
[-] 查找思路：
若树非空，目标值与节点的值比较：
若相等，则查找成功；
若小于根节点，则在左子树上查找，否则在右子树上查找；
查找成功返回节点指针，失败返回NULL

下面是个完整的代码，包括构建二叉树，查找，删除和中序遍历：

#include<iostream>
using namespace std;


//结构体，二叉排序树节点
typedef struct BSTNode{
	int data;
	struct BSTNode *lchild, *rchild;
}BSTNode, *BSTree;

//二叉排序树中查找值为data的节点
//非递归，循环
BSTNode *BST_Search(BSTree T, int key){
	while(T != NULL && key != T->data){
	 	//若树空（未找到），或等于根节点值，则结束循环
		if(key < T->data) T = T->lchild;		//小于，在左子树上查找
		else T = T->rchild;			//大于，在右子树上查找
	}
	return T;
}

//递归查找 
BSTNode *SearchBST(BSTree T, int key){
	if(T == NULL) return NULL;	//查找失败
	if(key == T->data)	return T;	//查找成功
	else if (key < T->data)
		return SearchBST(T->lchild, key);		//在左子树查找
	else
		return SearchBST(T->rchild, key);		//在右子树查找
}


//插入 ，递归 
void InsertBST(BSTree &T,int e){
	if(T == NULL){                		//!T	//找到插入位置，叶子节点（或根） 
		BSTree S = new BSTNode;            //生成新结点S
		S->data = e;                  		//新结点S的关键字为e   
		S->lchild = S->rchild = NULL;		//新结点S作为叶子结点
		T = S;            					//把新结点S链接到已找到的插入位置
	}
	//这里不考虑相同的数字，有相同的数只算一个 
	else if (e< T->data) 
		InsertBST(T->lchild, e );			//将S插入左子树
	else if (e> T->data) 
		InsertBST(T->rchild, e);			//将S插入右子树
}// InsertBST 

void CreateBST(BSTree &T ) {
	//依次读入一个关键字为key的结点，将此结点插入二叉排序树T中
	T=NULL;
	int e;
	cout<<"请输入若干整数，用空格分开，以-1结束输入"<<endl;
	cin>>e;
	while(e != -1){			//-1，结束标志
	InsertBST(T, e);		//将此结点插入二叉排序树T中
	cin>>e;	
	}            
}//CreatBST

void DeleteBST(BSTree &T,int key) {
	//从二叉排序树T中删除关键字等于key的结点
	BSTree p=T;
	BSTree f=NULL;                     	//初始化
	BSTree q,s;
	
	while(p){
	//从根开始查找关键字等于key的结点*p           
	if (p->data == key) break;  	      	//找到关键字等于key的结点*p，结束循环
	f=p;                                		//*f为*p的双亲结点
	if(p->data> key)
		p=p->lchild;     	//在*p的左子树中继续查找
	else
		p=p->rchild;  	                  		//在*p的右子树中继续查找
	}//while
  
	if(!p) return;				//p==NULL	//找不到被删结点则返回
	
	/*―考虑三种情况实现p所指子树内部的处理：*p左右子树均不空、无右子树、无左子树―*/
	if((p->lchild) && (p->rchild)){     		//被删结点*p左右子树均不空
		q = p;
		s = p->lchild;
		while (s->rchild)                			//在*p的左子树中继续查找其前驱结点，即最右下结点
		{q = s; s = s->rchild;}	         		//向右到尽头
		p->data = s->data;               			//s指向被删结点的“前驱”
		if(q!=p){
		 q->rchild = s->lchild;     	//重接*q的右子树
		}
		else q->lchild = s->lchild;		//重接*q的左子树
		delete s;
	}else{
		if(!p->rchild){						//被删结点*p无右子树，只需重接其左子树
			q = p; p = p->lchild; 
		}
		else if(!p->lchild){               		//被删结点*p无左子树，只需重接其右子树
			q = p; p = p->rchild;
		}
		/*―――――将p所指的子树挂接到其双亲结点*f相应的位置―――――*/
		if(!f) T=p;                       			//被删结点为根结点
		else if (q==f->lchild) f->lchild = p;   	//挂接到*f的左子树位置
		else f->rchild = p;                 		//挂接到*f的右子树位置
		delete q;
	}
}//DeleteBST

//中序遍历
void InOrderTraverse(BSTree &T){
	if(T){
		InOrderTraverse(T->lchild);
		cout<<T->data<<" ";
		InOrderTraverse(T->rchild);
	}
}

int  main()
{
	BSTree T;
	CreateBST(T);		//相同的数只算一个 
	cout<<"当前有序二叉树中序遍历结果为："<<endl;
	InOrderTraverse(T);
	
	int key;//待查找或待删除内容
	cout<<"\n\n请输入待查找关键字（整数）："<<endl;
	cin>>key;
	BSTree result_1=BST_Search(T,key);	//循环查找 
	BSTree result_2=SearchBST(T,key);	//递归查找 
	if(result_1 && result_2)
		cout<<"循环和递归都，找到了关键字"<<key<<endl;
	else
		cout<<"未找到"<<key<<endl;
	
	cout<<"\n请输入待删除的关键字："<<endl;
	cin>>key;
	DeleteBST(T,key);
	cout<<"当前有序二叉树中序遍历结果为（删除后）："<<endl;
	InOrderTraverse(T);
    return 1;
}

在这里插入图片描述

平衡二叉排序树，AVL

AVL Tree链接
$\lvert 左子树高 -右子树高 \rvert \leq 1$ ，平衡因子只可取-1、0或1。

在这里插入图片描述

插入，四种情况
1）LL，右单旋转
在这里插入图片描述

2）RR，左单旋转
在这里插入图片描述
3）LR，左旋，右旋

在这里插入图片描述
4）RL，右旋，左旋

删除，步骤：
①删除节点（方法同，二叉排序树）

若删除的节点是叶子，直接删；
若删除的节点只有一个子树，用子树顶替删除位置；
若删除的节点有两棵子树，用前驱（或后继）结点顶替，并转化未对前驱（或后继）结点的删除。

②一路向上找到最小不平衡子树，找不到就over
③找最小不平衡子树下，”个头“最高的儿子，孙子
④根据孙子的位置，调整平衡（LL/RR/LR/RL）

孙子在LL：儿子右单旋；
孙子在RR：儿子左单旋；
孙子在LR：孙子先左旋，再右旋；
孙子再RL：孙子先右旋，再左旋；

⑤如果不平衡向上传导，继续②

红黑树，RBT

Red/Black Tree链接

为什么要发明红黑树：
在这里插入图片描述

简要特点：
左右跟，根叶黑
不红红，黑路同

详细特点：
左子树结点值 $\leq$ 根结点值 $\leq$ 右子树结点值
①每个结点或是红色,或是黑色的；
②根节点是黑色的；
③叶结点(外部结点、NULL结点、失败结点)均是黑色的；
④不存在两个相邻的红结点(即红结点的父节点和孩子结点均是黑色)；
⑤对每个结点,从该节点到任一叶结点的简单路径上,所含黑结点的数目相同；

在这里插入图片描述

插入，这张图xswl
这张图笑死我了

黑叔

在这里插入图片描述

红叔

B树

B-Tree 链接

在这里插入图片描述

令 $k=\lceil{m/2}\rceil$
$\cdot k^{h-1}-1$
$1+2(k-1)(k^0+k^1+\cdots+k^{h-2}) = 1+2(k^{h-1}-1) = 2 \cdot k^{h-1}-1$
高度为h的3阶B树，含有关键字个数至少是： $2^h-1$ ，同完全二叉树（满二叉）
高度为h的5阶B树，含有关键字个数至少是： $\cdot 3^{h-1}-1$

高度为h的完全二叉树至少 $2^{h-1}$ 个结点，最多 $2^{h}-1$ 个结点

下面说明下B树特征和形状，先来个5叉树，B树就是在多叉树加一些约束，
在这里插入图片描述
B树结构：

对于高度问题，

在这里插入图片描述

对于插入，看不懂跳过：
在这里插入图片描述
插入和删除：

B+树

B+树有点像是分块查找结构和B树的整合，只在叶子结点存信息，非叶结点仅（上面的）起索引作用，查找也是找到最下层；
B+树支持顺序查找和随机查找，叶子结点本身依关键字从小到大顺序链接
根据B+树的特征，在操作系统中用的挺多，从磁盘里读数据到内存、关系型数据库的“索引”（如MySQL）。

在这里插入图片描述

散列表（哈希表）

还是用图片粘上吧：
在这里插入图片描述

在这里插入图片描述

装填因子 $\alpha$ 越大，平均查找长度变大，“冲突”越多，查找效率越低

常见的散列函数

直接定址法， $\times key + b$
除留余数法， $\% p$ ，p取不大于散列表长度m但最接近或等于m的质数
数字分析法，设关键字是r进制数(如十进制数) ，而r个数码在各位上出现的频率不一定相同，可能在某些位上分布均匀一些，每种数码出现的机会均等；而在某些位上分布不均匀，只有某几种数码经常出现，此时可选取数码分布较为均匀的若干位作为散列地址。这种方法适合于已知的关键字集合，若更换了关键字，则需要重新构造新的散列函数。例：手机号后四位
平方取中法，这种方法得到的散列地址与关键字的每位都有关系，得到的散列地址分布比较均匀，适用于关键字的每位取值都不够均匀或均小于三别地址所需的位数

处理冲突方法

拉链法，下图：
开放定址法，下图：
- ①线性探测法： $d_i=0,1,2,3,\cdots,m-1$ ，即发生冲突时,每次往后探测相邻的下一个单元是否为空。线性探测法很容易造成同义词、非同义词的“聚集(堆积)”现象，严重影响查找效率产生原因——冲突后再探测一定是放在某个连续的位置。
  查找效率分析：
- ②平方探测法，当 $d_i=0^2, 1^2, -1^2, 2^2, -2^2, \cdots , k^2, -k^2$ 时,称为平方探测法,又称二次探测法,其中 $\leq m/2$ 。比起线性探测法更不容易产生“聚集（堆积）”问题。
- ③伪随机序列法， $d_i$ 是一个伪随机序列，自己定义的，如 $\ldots$
- ④再散列法（再哈希法）：除了原始的散列函数 $H (k e y)$ 之外，多准备几个散列函数，当散列函数冲突时，用下一个散列函数计算一个新地址，直到不冲突为止。