搜索

搜索:在集合中找元素,在,就搜索成功,而且有的时候还得需要返回这个元素;否则就失败。
搜索其实就是查找,根据给定的关键字(key)值,在由同一类型的数据元素构成的集合中确定一个其关键字(关键字,key,指的是数据元素中某个数据项,用它可以标识由同一类型的数据元素构成的集合中一个或一组数据元素。如果一个关键字可以惟一表示一个数据元素,则称其为主关键字,否则称其为次关键字。通常一个数据元素只有一个主码,但可以有多个次码)值与给定值相同的元素,并返回该数据元素在集合(一种数据结构)中的位置。若查找失败,此时应返回一个无用位置(NULL或-1)及失败信息。

查找一般有两种情况:
1、静态查找:指在查找过程中只是对数据元素进行查找
2、动态查找:指在实施查找的同时,插入找不到的数据元素,或从集合中删除已查找到的某个数据元素,即允许集合中元素进行变化。

查找的基本方法可以分为两大类:
1、比较查找
(1)基于线性表的查找(线性查找)
a、顺序查找,从前往后一次遍历,时间复杂度为O(n),可以是顺序表,也可以是链表。其平均查找长度(用平均查找长度来衡量查找算法的性能)为:ASL = P1*C1+…+Pn×Cn,其中Pi为查找第i个数据元素的概率,Ci为找到第i个数据时,已经进行过的比较次数。对于顺序查找的平均查找长度,C1 = 1,C2 = 2,…,Cn = n,而Pi = 1/n,所以其ASL = (n+1)/2 = n/2。其实查找使用的是主码,也就是说Pi都一样,所以说看平均比较次数就可以衡量查找算法的性能了。
b、折半查找(二分查找),前提是有序,而且还得使用顺序存储结构(顺序表),其时间复杂度为O(log2n)。其平均比较次数为log2(n+1) - 1 = log2n。
c、分块查找,要求是使用索引顺序结构(索引顺序表,了解一下就行),数据量大。
(2)基于树的查找(树型查找)
a、二叉树结构
二叉查找树(又称二叉搜索树/二叉排序树)
平衡二叉排序树:AVL树:如果一棵二叉搜索树是高度平衡的,那它就是AVL树
红黑树:红黑树是近似平衡的(因为红黑树能保证最长路径不超过最短路径的2倍),而且在实际应用中发现红黑树性能确实比AVL树性能高。
b、多叉树结构
B树;
B+树;
B * 树;
纯内存搜索,二叉树是足够的,大部分内存中的搜索用二叉树就可以了。多叉树用在硬盘(带有外部存储)的一个搜索。
2、计算查找:哈希查找

二叉搜索树
其定义为:二叉搜索树或者是一颗空树,或者是具有以下性质的二叉树:
1、若它的左子树不为空,则左子树上所有结点的值都小于根结点的值;
2、若它的右子树不为空,则右子树上所有结点的值都大于根结点的值;
3、它的左右子树也分别为二叉搜索树。
二叉搜索树本质上还是一棵二叉树,只不过有序了而已。其中的序是指升序,但不要局限于升序,降序也是可以的,就是左子树大于根,右子树小于根。

二叉搜索树性能分析
插入和删除操作必须先查找,查找效率代表了二叉搜索树各个操作(增/删/查)的性能。
但对于同一个关键码(主码)集合,如果个关键码插入的次序不同,可能得到不同结构的二叉搜索树。
在这里插入图片描述
最优情况下,二叉搜索树为完全二叉树,其平均比较次数为:log2n。
在这里插入图片描述
最差情况下,二叉搜索树为单支树,其平均比较次数为:n/2。
问题
如果退化成单支树,那么二叉搜索树的性能就失去了。那能否对其进行改进?无论按照什么次序插入关键码,都可以使二叉树的性能最佳?

平衡二叉搜索树
二叉搜索树虽然可以缩短查找的效率,但如果数据有序或接近有序,那么二叉搜索树将退化成单支树,此时查找元素就相当于在链表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。

AVL树
其定义为:一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:
1、它的左右子树高度之差(平衡因子,只可能1、-1、0)的绝对值不超过1;
2、它的左右子树也都是AVL树。
如果一棵二叉搜索树是高度平衡的,那它就是AVL树。如果它有n个结点的话,其高度可保持在,对log2n向下取整(4.9->4)+1,平均比较次数为:log2n。

红黑树
红黑树是一棵二叉搜索树,它在每个节点上增加了一个存储位来表示结点的颜色,可以是red或者black,通过对任何一条从根结点到叶子结点路径上的颜色约束,红黑树保证最长路径不超过最短路径的2倍,因而近似平衡。而且在实际应用中发现红黑树的性能确实比AVL树的性能高
性质:
1、每个结点不是红色就是黑色
2、根结点是黑色的
3、如果一个结点是红色的,则它的两个孩子结点是黑色的。就是红色之间彼此不能挨着。
4、对于每个结点,从该结点到其所有后代叶子结点的路径上,均包含相同数目的黑色结点。
5、每个叶子结点都是黑色的(此处的叶子结点指的是空结点)
在这里插入图片描述
总结上述5点,其实就只有3点:
1、一头一尾是黑的,尾就是空结点,尾结点实际上是不需要画出来的。
2、红的不能挨着红的
3、每条路径上黑色的数量要一样多,算不算空结点都无所谓。

思考
为什么满足上面的颜色约束性质,红黑树能保证最长路径不超过最短路径的2倍?
因为最短的只能是全黑,而最长的是在全黑中间隔插入红色。

AVL树 VS 红黑树
红黑树使用非严格的平衡来换取增删结点的时候旋转次数的降低,任何不平衡都会在3次旋转之内解决。正是因为这种近似平衡,降低了对旋转的要求,从而提高了性能。而AVL树是高度平衡的二叉搜索树,因此在增删结点的时候,根据不同情况,旋转的次数要比红黑树要多。
红黑树的查找略微逊色于AVL树,因为AVL树是严格的平衡。
所以从总体上来说,红黑树的性能要比AVL树的性能高。

在实际应用中,若搜索的次数远大于增删,那么选择AVL树;如果搜索和增删的次数几乎差不多,应该选择RB树。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值