常见的七种查找算法

数据结构是数据存储的方式,算法是数据计算的方式。在开发中,算法和数据结构息息相关。

1. 基本查找

也叫做顺序查找,核心是从0索引开始挨个往后查找

说明:顺序查找适合存储结构为数组或者链表

基本思想:顺序查找也称为线形查找,属于无序查找算法。从数据结构线的一端开始,顺序扫描,依次将遍历到的结点与要查找的值相比较。若相等则表示查找成功,若遍历结束仍没有找到相同的,表示查找失败。

示例代码:

public class A01_BasicSearchDemo1 {
    public static void main(String[] args) {
        //基本查找/顺序查找
        //核心:从0索引开始挨个往后查找
​
        //需求:定义一个方法利用基本查找,查询某个元素是否存在
        //数据如下:{131, 127, 147, 81, 103, 23, 7, 79}
​
        int[] arr = {131, 127, 147, 81, 103, 23, 7, 79};
        int number = 82;
        System.out.println(basicSearch(arr, number));
​
    }
​
    //参数:
    //一:数组
    //二:要查找的元素
​
    //返回值:表示当前元素是否存在
    public static boolean basicSearch(int[] arr, int number){
        //利用基本查找来查找number在数组中是否存在
        for (int i = 0; i < arr.length; i++) {
            if(arr[i] == number){
                return true;
            }
        }
        return false;
    }
}

如果我们要返回多个数据的话,可以把这些数据放到数组或者集合中

2. 二分查找

也叫做折半查找,提高查找效率

前提条件:数组中的数据数据必须是有序的

如果是无序的,也可以先进行排序。但是排序之后,会改变原有数据的顺序,查找出来的元素位置跟原来的元素可能是不一样的,所以排序之后再查找只能判断当前数据是否在容器当中,返回的索引无实际的意义。

核心逻辑:每次排除一半的查找范围

二分查找的过程:

  • min和max表示当前要查找的范围

  • mid是在min和max中间的

  • 如果要查找的元素在mid的左边,缩小范围时,min不变,max等于mid减一

  • 如果要查找的元素在mid的右边,缩小范围时,max不变,min等于mid加一

基本思想:折半查找,属于有序查找算法,用给定值先与中间结点比较,比较完之后有三种情况:

  • 相等

    说明找到了

  • 要查找的数据比中间节点小

    说明要查找的数字在中间节点左边

  • 要查找的数据比中间节点大

    说明要查找的数字在中间节点右边

代码示例:

package com.itheima.search;
​
public class A02_BinarySearchDemo1 {
    public static void main(String[] args) {
        //二分查找/折半查找
        //核心:每次排除一半的查找范围
​
        //需求:定义一个方法利用二分查找,查询某个元素在数组中的索引
        //数据如下:{7, 23, 79, 81, 103, 127, 131, 147}
​
        int[] arr = {7, 23, 79, 81, 103, 127, 131, 147};
        System.out.println(binarySearch(arr, 150));
    }
​
    public static int binarySearch(int[] arr, int number){
        //1.定义两个变量记录要查找的范围
        int min = 0;
        int max = arr.length - 1;
​
        //2.利用循环不断的去找要查找的数据
        while(true){
            if(min > max){
                return -1;
            }
            //3.找到min和max的中间位置
            int mid = (min + max) / 2;
            //4.拿着mid指向的元素跟要查找的元素进行比较
            if(arr[mid] > number){
                //4.1 number在mid的左边
                //min不变,max = mid - 1;
                max = mid - 1;
            }else if(arr[mid] < number){
                //4.2 number在mid的右边
                //max不变,min = mid + 1;
                min = mid + 1;
            }else{
                //4.3 number跟mid指向的元素一样
                //找到了
                return mid;
            }
​
        }
    }
}

3. 插值查找(二分查找改进)

二分查找中查找点计算如下:

mid=(low+high)/2, 即mid=low+1/2*(high-low)

我们可以将查找的点改进为如下:

mid=low+(key-a[low])/(a[high]-a[low])*(high-low),

这样,让mid值的变化更靠近关键字key,也就间接地减少了比较次数。

基本思想:基于二分查找算法,将查找点的选择改进为自适应选择,可以提高查找效率,当然,插值查找也属于有序查找。

细节:对于表长较大,而关键字分布又比较均匀的查找表来说,插值查找算法的平均性能比折半查找要好的多。反之,数组中如果分布非常不均匀,那么插值查找未必是很合适的选择。

代码跟二分查找类似,只要修改一下mid的计算方式即可。

4. 斐波那契查找

在介绍斐波那契查找算法之前,先介绍一下跟它紧密相连并且大家都熟知的一个概念——黄金分割。

黄金比例又称黄金分割,是指事物各部分间一定的数学比例关系,即将整体一分为二,较大部分与较小部分之比等于整体与较大部分之比,其比值约为1:0.618或1.618:1。

0.618被公认为最具有审美意义的比例数字,这个数值的作用不仅仅体现在诸如绘画、雕塑、音乐、建筑等艺术领域,而且在管理、工程设计等方面也有着不可忽视的作用,因此被称为黄金分割。

在数学中有一个非常有名的数学规律:斐波那契数列:1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89…….

(从第三个数开始,后边每一个数都是前两个数的和)。

然后我们会发现,随着斐波那契数列的递增,前后两个数的比值会越来越接近0.618,利用这个特性,我们就可以将黄金比例运用到查找技术中。

基本思想:也是二分查找的一种提升算法,通过运用黄金比例的概念在数列中选择查找点进行查找,提高查找效率。同样地,斐波那契查找也属于一种有序查找算法。

mid = min + 黄金分割点左半边长度 - 1

斐波那契查找也是在二分查找的基础上进行了优化,优化中间点mid的计算方式即可

二分查找、插值查找、斐波那契查找各自的特点:

  • 相同点:都是通过不断的缩小范围来查找对应的数据的

  • 不同点:计算mid的方式不一样

  1. 二分查找:mid每次都是指向范围的中间位置

  2. 插值查找:mid尽可能的靠近要查找的数据,但是要求数据尽可能的分布均匀

  3. 斐波那契查找:根据黄金分割点来计算mid指向的位置

5. 分块查找

当数据表中的数据元素很多时,可以采用分块查找。

汲取了顺序查找和折半查找各自的优点,既有动态结构,又适于快速查找。

分块查找适用于数据较多,但是数据不会发生变化的情况,如果需要一边添加一边查找,建议使用哈希查找。

分块的原则1:前一块中的最大数据,小于后一块中的所有的数据(块内无序、块间有序)

分块的原则2:块数数量一般等于数字个数开根号。比如:16个数字一般分为四块左右

核心思路:先确定要查找的元素在哪一块,然后在块内挨个查找

分块查找的过程:

  1. 需要把数据分成N多小块,块与块之间不能有数据重复的交集

  2. 给每一块创建对象,单独存储到数组当中

  3. 查找数据的时候,先在数组查,当前数据属于哪一块

  4. 再到这一块中顺序查找

6. 哈希查找

哈希查找是分块查找的进阶版,适用于数据一边添加一边查找的情况。

一般是数组 + 链表的结合体或者是数组+链表 + 红黑树的结合体

为了方便理解,所以规定:

  • 数组的0索引处存储1~100

  • 数组的1索引处存储101~200

  • 数组的2索引处存储201~300

  • 以此类推

但是实际上,我们一般不会采取这种方式,因为这种方式容易导致一块区域添加的元素过多,导致效率偏低。

更多的是先计算出当前数据的哈希值,用哈希值跟数组的长度进行计算,计算出应存入的位置,再挂在数组的后面形成链表,如果挂的元素太多而且数组长度过长,我们也会把链表转化为红黑树,进一步提高效率。

7. 树表查找

基本思想:二叉查找树是先对待查找的数据生成树,确保树的左分支的值小于右分支的值,然后在就行和每个节点的父节点比较大小,查找最适合的范围。 这个算法的查找效率很高,但是如果使用这种查找方法要首先创建树。

二叉查找树,也叫二叉搜索树,或称二叉排序树,具有下列性质:

  1. 任意节点左子树上所有的数据,均小于本身

  2. 任意节点右子树上所有的数据,均大于本身

二叉查找树性质:对二叉查找树进行中序遍历,即可得到有序的数列。

基于二叉查找树进行优化,进而可以得到其他的树表查找算法,如平衡树、红黑树等高效算法。不管是二叉查找树,还是平衡二叉树,还是红黑树,查找的性能都比较高。

  • 18
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值