查找算法及其扩展

一、顺序查找

基本思想
从表中指定位置(一般为最后一个,第0个位置设为岗哨)的记录开始,沿某个方向将记录的关键字与给定值相比较,若某个记录的关键字和给定值相等,则查找成功;反之,若找完整个顺序表,都没有与给定关键字值相等的记录,则此顺序表中没有满足查找条件的记录,查找失败。

性能分析

(1) 空间复杂度: O(1)
(2) 时间复杂度:查找算法的基本运算是给定值与顺序表中记录关键字值的比较。

最好情况: O(1)
​最坏情况: O(n)
平均情况: O(n)

public class SequentialSearch {
    public static void main(String[] args) {
        int[] arr = {1, 3, 5, 2, 4, 8, 7};
        int index = find(arr, arr.length, 4);
        
        if (index == -1) {
            System.out.println("没找到");
        } else {
            System.out.println(index);
        }
    }

    private static int find(int[] arr, int right, int findValue) {
        for (int i = 0; i < right; i++) {
            if (arr[i] == findValue) { 
                return i;
            }
        }
        return -1;
    }
}

二、二分查找

基本思想

也称为是折半查找,属于有序查找算法。用给定值k先与中间结点的关键字比较,中间结点把线形表分成两个子表,若相等则查找成功;若不相等,再根据k与该中间结点关键字的比较结果确定下一步查找哪个子表,这样递归进行,直到查找到或查找结束发现表中没有这样的结点。

注意:元素必须是有序的

递归解法:

public class 二分查找 {
    public static void main(String[] args) {
        int[] arr = {1, 8, 10, 89, 1000, 1234};
        int resindex = binarySearch(arr, 0, arr.length - 1, 89);
        System.out.println("resIndex=" + resindex);
        System.out.println("--------");
        
        // 有相同值
        int[] arr1 = {1, 8, 10, 89, 1000, 1000, 1000, 1234};
        List<Integer> resIndexlist = binarySearch2(arr1, 0, arr.length - 1, 1000);
        System.out.println("resIndexlist=" + resIndexlist);
    }
    // 二分查找算法

    /**
     * @param arr     数组
     * @param left    左边的索引
     * @param right   右边的索引
     * @param findVal 要查找的值
     * @return 如果找到就返回下标,如果没有找到就返回-1
     */
    private static int binarySearch(int[] arr, int left, int right, int findVal) {
        System.out.println("查找次数");
        // 当left>right时,说明递归整个数组,但是没有找到
        if (left > right) {
            return -1;
        }
        int mid = left + (right - left) / 2; // 中间索引
        int midVal = arr[mid];
        if (findVal > midVal) { // 向右递归
            return binarySearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) { // 向左递归
            return binarySearch(arr, left, mid - 1, findVal);
        } else { // 找到了
            return mid;
        }
    }

    /**
     * 扩展:找到多个相同的数值
     * {1, 8, 10, 89, 1000, 1000, 1000, 1234};
     * 思路分析:
     * 1.在找到mid索引值,不要马上返回
     * 2.向mid索引值得左边扫描,将满足1000,的元素的下标,加入到集合ArrayList
     * 3.向mid索引值得右边扫描,将满足1000,的元素的下标,加入到集合ArrayList
     * 4.将ArrayList返回
     */
    private static ArrayList<Integer> binarySearch2(int[] arr, int left, int right, int findVal) {
        // 当left>right时,说明递归整个数组,但是没有找到
        if (left > right) {
            return new ArrayList<Integer>();
        }
        int mid = left + (right - left) / 2; // 中间索引
        int midVal = arr[mid];
        if (findVal > midVal) { // 向右递归
            return binarySearch2(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) { // 向左递归
            return binarySearch2(arr, left, mid - 1, findVal);
        } else { // 找到了
            ArrayList<Integer> resIndexlist = new ArrayList<>();
            // 向mid索引值得左边扫描,将满足1000,的元素的下标,加入到集合ArrayList
            int temp = mid - 1;
            while (true) {
                if (temp < 0 || arr[temp] != findVal) { // 退出
                    break;
                }
                // 否则,就temp 放入到resIndexlist
                resIndexlist.add(temp);
                temp--;
            }
            resIndexlist.add(mid); // 最后放中间的

            // 向mid索引值得右边扫描,将满足1000,的元素的下标,加入到集合ArrayList
            temp = mid + 1;
            while (true) {
                if (temp > arr.length - 1 || arr[temp] != findVal) { // 退出
                    break;
                }
                // 否则,就temp 放入到resIndexlist
                resIndexlist.add(temp);
                temp++;
            }
            return resIndexlist;
        }
    }
}

非递归解法:

public class 二分查找非递归 {
    public static void main(String[] args) {
        int[] arr={1,3,8,10,11,67,100};
        int index=binarySearch(arr,8);
        System.out.println("index="+index);
    }

    //二分查找非递归实现

    /**
     * @param arr    待查找的数组,arr是升序排列
     * @param target 需要查找的数
     * @return 返回对应下标,-1表示没有找到
     */
    private static int binarySearch(int[] arr, int target) {
        int left = 0;
        int right = arr.length - 1;
        while (left <= right) {// 可以继续查找
            int mid = (left + right) / 2; // 中间索引
            if (arr[mid] == target) {
                return mid;
            } else if (arr[mid] > target) {
                right = mid - 1;// 需要向左边查找
            } else {
                left = mid + 1;
            }
        }
        return -1;
    }
}

扩展:二分思想

空字符串

有个排序后的字符串数组,其中散布着一些空字符串,编写一个方法,找出给定字符串(肯定不是空字符串的索引)

public class NStr {
    public static void main(String[] args) {
        String[] arr = {"a", "", "ac", "", "ad", "b", "", "ba"};
        int res = indexOf(arr, "b");
        System.out.println(res);
    }

    /**
     * 寻找字符串元素
     *
     * @param arr 字符串数组
     * @param p   要寻找的字符串
     * @return 返回索引
     */
    public static int indexOf(String[] arr, String p) {
        int begin = 0;
        int end = arr.length - 1;
        while (begin <= end) {
            int indexOfMid = begin + ((end - begin) >> 1); // 中间索引
            while (arr[indexOfMid].equals("")) {
                indexOfMid++;
                if (indexOfMid > end) {
                    return -1;
                }
            }
            if (arr[indexOfMid].compareTo(p) > 0) {
                end = indexOfMid - 1;
            } else if (arr[indexOfMid].compareTo(p) < 0) {
                begin = indexOfMid + 1;
            } else {
                return indexOfMid;
            }
        }
        return -1;
    }
}

最小可用id

在非负数组(乱序)中找到最小的可分配的id(从1开始编号),数据量为1000000

  1. 暴力解法:从1开始依次探测每个自然数是否在数组中,如果不在则返回 时间复杂度:O(n^2)
  2. 先排序,返回不在位的最小的自然数 时间复杂度:NlogN
  3. 新建长为n+1的数组F,初始值全为false,扫描原数组中的元素,小于n则将F[A[i]-1]记录为
    true,最后再扫描F,返回第一个false的元素的下标 注:有点类似于计数排序O(n),但是浪费空间
  4. 分区递归
public class LeastId {
    public static void main(String[] args) {
        int[] arr = {1, 4, 3, 5, 10, 7, 100};
        System.out.println(find1(arr));
        System.out.println(find2(arr));
        System.out.println(find3(arr));
        System.out.println(find4(arr, 0, arr.length - 1));
    }

    // 1
    public static int find1(int[] arr) {
        int i = 1;
        int count;
        while (true) {
            count = 0;
            for (int j = 0; j < arr.length; j++) {
                if (i == arr[j]) {
                    count++;
                }
            }
            if (count == 0) {
                return i;
            }
            i++;
        }
    }

    // 2
    public static int find2(int[] arr) {
        Arrays.sort(arr);//O(NlogN)
        // O(N)
        int i = 0;
        while (i < arr.length) {
            if (i + 1 != arr[i]) {
                return i + 1;
            }
            i++;
        }
        return i + 1;
    }

    // 3
    public static int find3(int[] arr) {
        int[] helper = new int[arr.length + 1];
        for (int i = 0; i < arr.length; i++) {
            if (arr[i] < helper.length)
                helper[arr[i]] = 1;
        }
        for (int i = 1; i < helper.length; i++) {
            if (helper[i] == 0) {
                return i;
            }
        }
        return arr.length + 1;
    }

    // 4
    public static int find4(int[] arr, int l, int r) {
        if (l > r) {
            return l + 1;
        }
        int midIndex = l + ((r - l) >> 1); // 中间下标
        int q = theK.findK(arr, midIndex - l + 1, l, r);
        int t = midIndex + 1; // 期望值
        if (q == t) { // 左侧紧密
            return find4(arr, midIndex + 1, r);
        } else { // 左侧稀疏
            return find4(arr, l, midIndex - 1);
        }
    }
}

旋转数组中的最小数字

把一个数组最开始的若干个元素搬到数组的末尾,我们称之为数组的旋转。输入一个递增排序的数组的一个旋转,输出旋转数组的最小元素。例如数组{3,4,5,1,2}为{1,2,3,4,5}的一个旋转,该数组的最小值为1

public class RotateArrLeastNum {
    public static void main(String[] args) {
        int[] arr = new int[]{3, 4, 5, 1, 2};
        System.out.println(reverse(arr));
    }

    private static int reverse(int[] arr) {
        int begin = 0;
        int end = arr.length - 1;
        // 如果没有旋转
        if (arr[begin] < arr[end]) {
            return arr[begin];
        }
        while (begin + 1 < end) {
            int mid = begin + ((end - begin) >> 1);
            // 要么左侧有序,要么右侧有序
            if (arr[mid] >= arr[begin]) {
                begin = mid;
            } else {
                end = mid;
            }
        }
        return arr[end];
    }
}

超过一半的数

数组中有一个数字出现的次数超过了数组长度的一半,找出这个数字

  • 解法一:排序后返回arr[N/2], Nlg(N)
  • 解法二:hash统计
  • 解法三:顺序统计 不需要求具体顺序 求第N/2个元素 O(N),限制:需要改动数组的内容
  • 解法四:不同的数进行消除;
    • 先记第一个元素出现的次数为1(候选),如果后一个元素与之相等,则+1;否则-1
    • 当count为0时,将当前元素的次数记为1,结束本次循环,最后没有被消除的数
    • 就是超过列表一半的数;
public class HalfNum {
    public static void main(String[] args) {
        int[] arr = {1, 2, 2, 2, 3};
        findK(arr);
    }

    public static void findK(int[] arr) {
        int candidate = arr[0]; // 候选数
        int count = 1; // 出现的次数
        for (int i = 1; i < arr.length; i++) {
            if (count == 0) {
                candidate = arr[i];
                count = 1;
                continue;
            }
            if (arr[i] == candidate) {
                count++;
            } else {
                count--;
            }
        }
        System.out.println(candidate);
    }
}

寻找发帖水王

Tango是微软亚洲研究院的一个试验项目。研究院的员工和实习生们都很喜欢在Tango上面交流灌水。传说,Tango有一大"水王",他不但喜欢发帖,还会回复其他ID发的贴子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上的所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗?变化:出现的次数恰好为个数的一半,求出这个数。

关于加强版水王的题,可以扫描一遍数组解决问题:
水王总数占一半,说明总数必为偶数
不失一般性,假设隔一个数就是水王的id,两两不同最后一定会消减为0
水王可能是最后一个元素,每次扫描的时候,多一个动作,和最后一个元素做比较单独计数,计数恰好等于一半;如果不是,计数不足一半,那么去掉最后一个元素,水王就是留下的那个candidate。

public class FindWin {
    public static void main(String[] args) {
        int[] arr = {2, 2, 2, 1, 3, 4};
        findK(arr);
    }

    public static void findK(int[] arr) {
        int candidate = arr[0]; // 候选数
        int count = 0; // 出现的次数
        int countOfLast = 0; // 统计最后这个元素出现的次数
        int N = arr.length;
        for (int i = 0; i < arr.length; i++) {
            if (arr[i] == arr[N - 1]) {
                countOfLast++;
            }
            if (count == 0) {
                candidate = arr[i];
                count = 1;
                continue;
            }
            if (arr[i] == candidate) {
                count++;
            } else {
                count--;
            }
        }
        if (countOfLast == N / 2) { // 最后一个元素出现的次数为N/2
            System.out.println(arr[N - 1]);
        }else {
            System.out.println(candidate);
        }
    }
}

三、插值查找

插值查找原理介绍:

  • 插值查找算法类似于二分查找,不同的是插值查找每次从自适应mid处开始查找。

  • 将折半查找中的求mid 索引的公式 , low 表示左边索引left, high表示右边索引right.key 就是前面我们讲的 findVal
    在这里插入图片描述

  • int mid = low + (high - low) * (key - arr[low]) / (arr[high] - arr[low]) ;插值索引对应前面的代码公式:int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left])

插值查找注意事项:

  • 对于数据量较大,关键字分布比较均匀的查找表来说,采用插值查找, 速度较快.

  • 关键字分布不均匀的情况下,该方法不一定比折半查找要好
    在这里插入图片描述

public class 插值查找 {
    public static void main(String[] args) {
        int[] arr = new int[100];
        for (int i = 0; i < 100; i++) {
            arr[i] = i + 1;
        }
        int index = insertValueSearch(arr, 0, arr.length-1, 50);
        System.out.println("index=" + index);
    }
    // 插值查找算法也要求数组有序

    /**
     * @param arr       数组
     * @param left      左边索引
     * @param right     右边索引
     * @param findValue 查找值
     * @return 如果找到,就返回对应的下标,如果没有找到,返回-1
     */
    private static int insertValueSearch(int[] arr, int left, int right, int findValue) {
        System.out.println("查找次数");
        // 注意:findVal<arr[0]和findVal>arr[arr.length-1]必须需要
        // 否则我们得到的mid可能越界
        if (left > right || findValue < arr[0] || findValue > arr[arr.length - 1]) {
            return -1;
        }
        // 求出mid
        int mid = left + (right - left) * (findValue - arr[left]) / (arr[right] - arr[left]);
        int midVal = arr[mid];
        if (findValue > midVal) { // 向右查找
            return insertValueSearch(arr, mid + 1, right, findValue);
        } else if (findValue < midVal) { // 向左查找
            return insertValueSearch(arr, left, mid - 1, findValue);
        } else {
            return mid;
        }
    }
}

四、斐波那契查找

斐波那契(黄金分割法)查找基本介绍:

  • 黄金分割点是指把一条线段分割为两部分,使其中一部分与全长之比等于另一部分与这部分之比。取其前三位数字的近似值是0.618。由于按此比例设计的造型十分美丽,因此称为黄金分割,也称为中外比。这是一个神奇的数字,会带来意向不大的效果。
  • 斐波那契数列 {1, 1, 2, 3, 5, 8, 13, 21, 34, 55 } 发现斐波那契数列的两个相邻数 的比例,无限接近 黄金分割值0.618

斐波那契(黄金分割法)原理:

  • 斐波那契查找原理与前两种相似,仅仅改变了中间结点(mid)的位置,mid不再是中间或插值得到,而是位于黄金分割点附近,即mid=low+F(k-1)-1(F代表斐波那契数列),如下图所示
    在这里插入图片描述
    对F(k-1)-1的理解:
  • 由斐波那契数列 F[k]=F[k-1]+F[k-2] 的性质,可以得到 (F[k]-1)=(F[k-1]-1)+(F[k-2]-1)+1 。该式说明:只要顺序表的长度为F[k]-1,则可以将该表分成长度为F[k-1]-1和F[k-2]-1的两段,即如上图所示。从而中间位置为mid=low+F(k-1)-1
  • 类似的,每一子段也可以用相同的方式分割
  • 但顺序表长度n不一定刚好等于F[k]-1,所以需要将原来的顺序表长度n增加至F[k]-1。这里的k值只要能使得F[k]-1恰好大于或等于n即可,由以下代码得到,顺序表长度增加后,新增的位置(从n+1到F[k]-1位置),都赋为n位置的值即可。
public class 斐波那契查找 {

    public static int maxSize = 20;

    public static void main(String[] args) {
        int[] arr = {1, 8, 10, 89, 1000, 1234};
        System.out.println("index=" + fibSearch(arr, 10));
    }

    // 因为后面我们mid=low+F(k-1)-1,需要使用到斐波那契数列,因此我们需要先获取到一个斐波那契数列
    // 非递归方法得到一个斐波那契数列
    private static int[] fib() {
        int[] f = new int[maxSize];
        f[0] = 1;
        f[1] = 1;
        for (int i = 2; i < maxSize; i++) {
            f[i] = f[i - 1] + f[i - 2];
        }
        return f;
    }

    // 编写斐波那契查找算法
    // 非递归方式

    /**
     * @param arr 数组
     * @param key 我们需要查找的关键值
     * @return 返回对应值的下标,如果没有-1
     */
    private static int fibSearch(int[] arr, int key) {
        int low = 0;
        int high = arr.length - 1;
        int k = 0; // 表示斐波那契分割数值的下标
        int mid = 0; // 存放mid值
        int[] f = fib(); // 获取斐波那契数列
        // 获取斐波那契分割数值的下标
        while (high > f[k] - 1) {
            k++;
        }
        // 因为f[k]值可能大于数组arr的长度,因此我们需要使用Arrays类,构造一个新的数组,并指向temp[]
        // 不足的部分会使用0填充
        int[] temp = Arrays.copyOf(arr, f[k]);
        // 实际上需要使用arr数组最后的数填充temp
        // 举例:
        // temp={1, 8, 10, 89, 1000, 1234,0,0,0}-->{1, 8, 10, 89, 1000, 1234,1234,1234,1234}
        for (int i = high + 1; i < temp.length; i++) {
            temp[i] = arr[high];
        }
        // 使用while来循环处理,找到我们的数key
        while (low <= high) {
            mid = low + f[k - 1] - 1;
            if (key < temp[mid]) {// 向数组的左边查找
                high = mid - 1;
                // 为什么是k--
                // 说明
                // 1.全部元素=前面的元素+后面的元素
                // 2.f[k]=f[k-1]+f[k-2]
                // 因为前面有f[k-1]个元素,所以可以继续拆分f[k-1]=f[k-2]+f[k-3]
                // 即在f[k-1]的前面继续查找   k--
                // 即下次循环mid=f[k-1-1]-1
                k--;
            } else if (key > temp[mid]) { // 向数组右边查找
                low = mid + 1;
                // 为什么是k-=2
                // 说明
                // 1.全部元素=前面的元素+后后面的元素
                // 2.f[k]=f[k-1]+f[k-2]
                // 3.因为后面我们有f[k-2] 所以可以继续拆分f[k-1]=f[k-3]+f[k-4]
                // 4.即在f[k-2]的前面进行查找k-=2
                // 5.即下次循环mid=f[k-1-2]-1
                k -= 2;
            } else { // 找到
                // 需要确定,返回的是那个下标
                if (mid <= high) {
                    return mid;
                } else {
                    return high;
                }
            }
        }
        return -1;
    }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

明仔爱编程

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值