查找算法的分析与实现

柠砸

已于 2022-02-03 22:43:31 修改

阅读量729

点赞数

分类专栏：数据结构与算法文章标签：算法散列表数据结构

于 2022-01-26 16:33:14 首次发布

本文链接：https://blog.csdn.net/weixin_62226325/article/details/122703529

版权

数据结构与算法专栏收录该内容

22 篇文章 1 订阅

订阅专栏

▲查找的介绍：

查找是在大量的信息中寻找一个特定的信息元素，在计算机应用中，查找是常用的基本运算，例如编译程序中符号表的查找。本文简单概括性的介绍了常见的七种查找算法，说是七种，其实二分查找、插值查找以及斐波那契查找都可以归为一类——插值查找。插值查找和斐波那契查找是在二分查找的基础上的优化查找算法。树表查找和哈希查找会在后续的博文中进行详细介绍。

查找定义：根据给定的某个值，在查找表中确定一个其关键字等于给定值的数据元素（或记录）。

查找算法分类：

1）静态查找和动态查找；

　　　　注：静态或者动态都是针对查找表而言的。动态表指查找表中有删除和插入操作的表。

　　2）无序查找和有序查找。

　　　　无序查找：被查找数列有序无序均可；

　　　　有序查找：被查找数列必须为有序数列。

平均查找长度（Average Search Length，ASL）：需和指定key进行比较的关键字的个数的期望值，称为查找算法在查找成功时的平均查找长度。

　　对于含有n个数据元素的查找表，查找成功的平均查找长度为：ASL = Pi*Ci的和。
　　Pi：查找表中第i个数据元素的概率。
　　Ci：找到第i个数据元素时已经比较过的次数。

1.顺序（线性）查找算法：

说明：顺序查找适合于存储结构为顺序存储或链接存储的线性表。

基本思想：顺序查找也称为线形查找，属于无序查找算法。从数据结构线形表的一端开始，顺序扫描，依次将扫描到的结点关键字与给定值k相比较，若相等则表示查找成功；若扫描结束仍没有找到关键字等于k的结点，表示查找失败。

复杂度分析：　

　　查找成功时的平均查找长度为：（假设每个数据元素的概率相等） ASL = 1/n(1+2+3+…+n) = (n+1)/2 ;
　　当查找不成功时，需要n+1次比较，时间复杂度为O(n);

　　所以，顺序查找的时间复杂度为O(n)。

public class sequence{
	public static  int SequenceSearch(int arr[],int value){
		for( int i = 0 ; i < arr.length;i++){
			if( value == arr[i])
				return i;
			else
				return -1;
		}
		return false;
	}
	public static void main(String[] args) {
		int[] arr = {8,2,4,5,3,10,11,6,9};
        int index = SequenceSearch(arr,10)
        if(index == -1){
            System.out.println("未找到");
        }else{
             System.out.print("找到了，坐标为%d"，index);
        }
	}
}

2.二分查找算法：

说明：元素必须是有序的，如果是无序的则要先进行排序操作。

基本思想：也称为是折半查找，属于有序查找算法。用给定值k先与中间结点的关键字比较，中间结点把线形表分成两个子表，若相等则查找成功；若不相等，再根据k与该中间结点关键字的比较结果确定下一步查找哪个子表，这样递归进行，直到查找到或查找结束发现表中没有这样的结点。

▲思路分析：

复杂度分析：最坏情况下，关键词比较次数为log2(n+1)，且期望时间复杂度为O(log2n)；

注：折半查找的前提条件是需要有序表顺序存储，对于静态查找表，一次排序后不再变化，折半查找能得到不错的效率。但对于需要频繁执行插入或删除操作的数据集来说，维护有序的排序会带来不小的工作量，那就不建议使用。——《大话数据结构》

a）折半查找：

/*1.*/
public class BinarySearch1{
	
	public static int binarysearch(int[] a,int n,int value){
		int low = 0;
		int high = n - 1;
		int mid;
		while(low < high){
			mid = (low + high)/2;
			if(value < a[mid])
				high = mid - 1;
			if(value > a[mid])
				low = mid + 1;
			if(value == a[mid])
				return mid;
		}
		return -1;
	}
	public static void main(String[] args) {
		//int[] a = {1,4,2,9,8,6,7,0,3,5}
		int[] a = {0,1,2,3,4,5,6,7,8,9};
		System.out.println(binarysearch(a,a.length,7));
	} 
}

b）递归查找：

/*2.recursive algorithm 	*/
public class BinarySearch2{
	
	public static int binarysearch(int[] a,int value,int low,int high){
			int mid = (low + high)/2;
			if(value == a[mid])
				return mid;
			mid = (low + high)/2;
			if(value < a[mid])
				return binarysearch(a,value,low,mid - 1);
			if(value > a[mid])
				return binarysearch(a,value,mid + 1,high);	
			return -1;
	}
	public static void main(String[] args) {
		//int[] a = {1,4,2,9,8,6,7,0,3,5}
		int[] a = {0,1,2,3,4,5,6,7,8,9};
		System.out.println(binarysearch(a,4,0,a.length-1));
	} 
}

★问题：

当数组中多次出现同一个数据，只会返回找到的第一个的索引指，故我们需要解决如下的问题：

思路分析 ：

1. 在找到 mid 索引值，不要马上返回 *

2. 向 mid 索引值的左边扫描，将所有满足 1000，的元素的下标，加入到集合 ArrayList *

3. 向 mid 索引值的右边扫描，将所有满足 1000，的元素的下标，加入到集合 ArrayList *

4. 将 Arraylist返回

▲具体代码实现：

public static List<Integer> binarySearch2(int[] arr, int left, int right, int findVal) {
        // 当 left > right 时，说明递归整个数组，但是没有找到
        if (left > right) {
            return new ArrayList<Integer>();
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];
        if (findVal > midVal) { // 向 右递归
            return binarySearch2(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) { // 向左递归
            return binarySearch2(arr, left, mid - 1, findVal);
        } else {
            // * 思路分析
            // * 1. 在找到 mid 索引值，不要马上返回
            // * 2. 向 mid 索引值的左边扫描，将所有满足 1000， 的元素的下标，加入到集合 ArrayList
            // * 3. 向 mid 索引值的右边扫描，将所有满足 1000， 的元素的下标，加入到集合 ArrayList
            // * 4. 将 Arraylist 返回
            List<Integer> resIndexlist = new ArrayList<Integer>();
            //向 mid 索引值的左边扫描，将所有满足 1000， 的元素的下标，加入到集合 ArrayList
            int temp = mid - 1;
            while (true) {
                if (temp < 0 || arr[temp] != findVal) {//退出
                    break;
                }
                //否则，就 temp 放入到 resIndexlist
                resIndexlist.add(temp);
                temp -= 1; //temp 左移
            }
            resIndexlist.add(mid); //
            //向 mid 索引值的右边扫描，将所有满足 1000， 的元素的下标，加入到集合 ArrayList
            temp = mid + 1;
            while (true) {
                if (temp > arr.length - 1 || arr[temp] != findVal) {//退出
                    break;
                }
                //否则，就 temp 放入到 resIndexlist
                resIndexlist.add(temp);
                temp += 1; //temp 右移
            }
            return resIndexlist;
        }
    }

3.插值查找：

1) 插值查找原理介绍: 插值查找算法类似于二分查找，不同的是插值查找每次从自适应 mid 处开始查找。

2) 将折半查找中的求 mid 索引的公式 , low 表示左边索引 left, high 表示右边索引 right. key 就是前面我们讲的 findVal

3) int mid = low + (high - low) * (key - arr[low]) / (arr[high] - arr[low]) ;/*插值索引*/ 对应前面的代码公式： int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left])

4) 举例说明插值查找算法 1-100 的数组

具体代码实现;

//编写插值查找算法
//说明：插值查找算法，也要求数组是有序的
/**
 *
 * @param arr 数组
 * @param left 左边索引
 * @param right 右边索引
 * @param findVal 查找值
 * @return 如果找到，就返回对应的下标，如果没有找到，返回-1
 */
public static int insertValueSearch(int[] arr, int left, int right, int findVal) {
        System.out.println("插值查找次数~~");
        //注意：findVal < arr[0] 和 findVal > arr[arr.length - 1] 必须需要
        //否则我们得到的 mid 可能越界
        if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
            return -1;
        }
        // 求出 mid, 自适应
        int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
        int midVal = arr[mid];
        if (findVal > midVal) { // 说明应该向右边递归
            return insertValueSearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) { // 说明向左递归查找
            return insertValueSearch(arr, left, mid - 1, findVal);
        } else {
            return mid;
        }
}

★插值查找注意事项：

1) 对于数据量较大，关键字分布比较均匀的查找表来说，采用插值查找, 速度较快.

2) 关键字分布不均匀的情况下，该方法不一定比折半查找要好

4.斐波那契(黄金分割法)查找算法

▲基本介绍：

1) 黄金分割点是指把一条线段分割为两部分，使其中一部分与全长之比等于另一部分与这部分之比。取其前三位数字的近似值是 0.618。由于按此比例设计的造型十分美丽，因此称为黄金分割，也称为中外比。这是一个神奇的数字，会带来意向不大的效果。

2) 斐波那契数列 {1, 1, 2, 3, 5, 8, 13, 21, 34, 55 } 发现斐波那契数列的两个相邻数的比例，无限接近黄金分割值 0.618

▲原理分析：

斐波那契查找原理与前两种相似，仅仅改变了中间结点（mid）的位置，mid 不再是中间或插值得到，而是位于黄金分割点附近，即 mid=low+F(k-1)-1（F 代表斐波那契数列），如下图所示

▲ 对 F(k-1)-1 的理解： 1) 由斐波那契数列 F[k]=F[k-1]+F[k-2] 的性质，可以得到（F[k]-1）=（F[k-1]-1）+（F[k-2]-1）+1 。该式说明：只要顺序表的长度为 F[k]-1，则可以将该表分成长度为 F[k-1]-1 和 F[k-2]-1 的两段，即如上图所示。从而中间位置为 mid=low+F(k-1)-1

2) 类似的，每一子段也可以用相同的方式分割

3) 但顺序表长度 n 不一定刚好等于 F[k]-1，所以需要将原来的顺序表长度 n 增加至 F[k]-1。这里的 k 值只要能使得 F[k]-1 恰好大于或等于 n 即可，由以下代码得到,顺序表长度增加后，新增的位置（从 n+1 到 F[k]-1 位置），都赋为 n 位置的值即可。

while(n>fib(k)-1)

k++；

★具体代码实现：

    public class FibonacciSearch {
        public static int maxSize = 20;

        public static void main(String[] args) {
            int[] arr = {1, 8, 10, 89, 1000, 1234};
            System.out.println("index=" + fibSearch(arr, 189));// 0
        }

        //因为后面我们 mid=low+F(k-1)-1，需要使用到斐波那契数列，因此我们需要先获取到一个斐波那契数列
        //非递归方法得到一个斐波那契数列
        public static int[] fib() {
            int[] f = new int[maxSize];
            f[0] = 1;
            f[1] = 1;
            for (int i = 2; i < maxSize; i++) {
                f[i] = f[i - 1] + f[i - 2];
            }
            return f;
        }
        //编写斐波那契查找算法
        //使用非递归的方式编写算法
        /**
         * @param a   数组
         * @param key 我们需要查找的关键码(值) * @return 返回对应的下标，如果没有-1
         */
        public static int fibSearch(int[] a, int key) {
            int low = 0;
            int high = a.length - 1;
            int k = 0; //表示斐波那契分割数值的下标
            int mid = 0; //存放 mid 值
            int f[] = fib(); //获取到斐波那契数列
            //获取到斐波那契分割数值的下标
            while (high > f[k] - 1) {
                k++;
            }
            //因为 f[k] 值 可能大于 a 的 长度，因此我们需要使用 Arrays 类，构造一个新的数组，并指向 temp[]
            //不足的部分会使用 0 填充
            int[] temp = Arrays.copyOf(a, f[k]);
            //实际上需求使用 a 数组最后的数填充 temp
            //举例:
            //temp = {1,8, 10, 89, 1000, 1234, 0, 0} => {1,8, 10, 89, 1000, 1234, 1234, 1234,}
            for (int i = high + 1; i < temp.length; i++) {
                temp[i] = a[high];
            }
            // 使用 while 来循环处理，找到我们的数 key
            while (low <= high) { // 只要这个条件满足，就可以找
                mid = low + f[k - 1] - 1;
                if (key < temp[mid]) { //我们应该继续向数组的前面查找(左边)
                    high = mid - 1;
                    //为甚是 k--
                    //说明
                    //1. 全部元素 = 前面的元素 + 后边元素
                    //2. f[k] = f[k-1] + f[k-2]
                    //因为 前面有 f[k-1]个元素,所以可以继续拆分 f[k-1] = f[k-2] + f[k-3]
                    //即 在 f[k-1] 的前面继续查找 k--
                    //即下次循环 mid = f[k-1-1]-1
                    k--;
                } else if (key > temp[mid]) { // 我们应该继续向数组的后面查找(右边)
                    low = mid + 1;
                    //为什么是 k -=2
                    //说明
                    //1. 全部元素 = 前面的元素 + 后边元素
                    //2. f[k] = f[k-1] + f[k-2]
                    //3. 因为后面我们有 f[k-2] 所以可以继续拆分 f[k-1] = f[k-3] + f[k-4]
                    //4. 即在 f[k-2] 的前面进行查找 k -=2
                    //5. 即下次循环 mid = f[k - 1 - 2] - 1
                    k -= 2;
                } else { //找到
                    //需要确定，返回的是哪个下标
                    if (mid <= high) {
                        return mid;
                    } else {
                        return high;
                    }
                }
            }
            return -1;
        }
    }