查找算法的分析与实现

▲查找的介绍:

查找是在大量的信息中寻找一个特定的信息元素,在计算机应用中,查找是常用的基本运算,例如编译程序中符号表的查找。本文简单概括性的介绍了常见的七种查找算法,说是七种,其实二分查找、插值查找以及斐波那契查找都可以归为一类——插值查找。插值查找和斐波那契查找是在二分查找的基础上的优化查找算法。树表查找和哈希查找会在后续的博文中进行详细介绍。

查找定义:根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素(或记录)。

查找算法分类:

1)静态查找和动态查找;

    注:静态或者动态都是针对查找表而言的。动态表指查找表中有删除和插入操作的表。

  2)无序查找和有序查找。

    无序查找:被查找数列有序无序均可;

    有序查找:被查找数列必须为有序数列。

平均查找长度(Average Search Length,ASL):需和指定key进行比较的关键字的个数的期望值,称为查找算法在查找成功时的平均查找长度。

  对于含有n个数据元素的查找表,查找成功的平均查找长度为:ASL = Pi*Ci的和。
  Pi:查找表中第i个数据元素的概率。
  Ci:找到第i个数据元素时已经比较过的次数。

1.顺序(线性)查找算法:

 说明:顺序查找适合于存储结构为顺序存储或链接存储的线性表。

基本思想:顺序查找也称为线形查找,属于无序查找算法。从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值k相比较,若相等则表示查找成功;若扫描结束仍没有找到关键字等于k的结点,表示查找失败。

复杂度分析: 

  查找成功时的平均查找长度为:(假设每个数据元素的概率相等) ASL = 1/n(1+2+3+…+n) = (n+1)/2 ;
  当查找不成功时,需要n+1次比较,时间复杂度为O(n);

  所以,顺序查找的时间复杂度为O(n)。

public class sequence{
	public static  int SequenceSearch(int arr[],int value){
		for( int i = 0 ; i < arr.length;i++){
			if( value == arr[i])
				return i;
			else
				return -1;
		}
		return false;
	}
	public static void main(String[] args) {
		int[] arr = {8,2,4,5,3,10,11,6,9};
        int index = SequenceSearch(arr,10)
        if(index == -1){
            System.out.println("未找到");
        }else{
             System.out.print("找到了,坐标为%d",index);
        }
	}
}

2.二分查找算法:

说明:元素必须是有序的,如果是无序的则要先进行排序操作。

        基本思想:也称为是折半查找,属于有序查找算法。用给定值k先与中间结点的关键字比较,中间结点把线形表分成两个子表,若相等则查找成功;若不相等,再根据k与该中间结点关键字的比较结果确定下一步查找哪个子表,这样递归进行,直到查找到或查找结束发现表中没有这样的结点。

▲思路分析:

        复杂度分析:最坏情况下,关键词比较次数为log2(n+1),且期望时间复杂度为O(log2n);

        注:折半查找的前提条件是需要有序表顺序存储,对于静态查找表,一次排序后不再变化,折半查找能得到不错的效率。但对于需要频繁执行插入或删除操作的数据集来说,维护有序的排序会带来不小的工作量,那就不建议使用。——《大话数据结构》 

a)折半查找:

/*1.*/
public class BinarySearch1{
	
	public static int binarysearch(int[] a,int n,int value){
		int low = 0;
		int high = n - 1;
		int mid;
		while(low < high){
			mid = (low + high)/2;
			if(value < a[mid])
				high = mid - 1;
			if(value > a[mid])
				low = mid + 1;
			if(value == a[mid])
				return mid;
		}
		return -1;
	}
	public static void main(String[] args) {
		//int[] a = {1,4,2,9,8,6,7,0,3,5}
		int[] a = {0,1,2,3,4,5,6,7,8,9};
		System.out.println(binarysearch(a,a.length,7));
	} 
}

 b)递归查找:

/*2.recursive algorithm 	*/
public class BinarySearch2{
	
	public static int binarysearch(int[] a,int value,int low,int high){
			int mid = (low + high)/2;
			if(value == a[mid])
				return mid;
			mid = (low + high)/2;
			if(value < a[mid])
				return binarysearch(a,value,low,mid - 1);
			if(value > a[mid])
				return binarysearch(a,value,mid + 1,high);	
			return -1;
	}
	public static void main(String[] args) {
		//int[] a = {1,4,2,9,8,6,7,0,3,5}
		int[] a = {0,1,2,3,4,5,6,7,8,9};
		System.out.println(binarysearch(a,4,0,a.length-1));
	} 
}

★问题:

        当数组中多次出现同一个数据,只会返回找到的第一个的索引指,故我们需要解决如下的问题:

思路分析

1. 在找到 mid 索引值,不要马上返回 *

2. 向 mid 索引值的左边扫描,将所有满足 1000, 的元素的下标,加入到集合 ArrayList *

3. 向 mid 索引值的右边扫描,将所有满足 1000, 的元素的下标,加入到集合 ArrayList *

4. 将 Arraylist返回

▲具体代码实现:

public static List<Integer> binarySearch2(int[] arr, int left, int right, int findVal) {
        // 当 left > right 时,说明递归整个数组,但是没有找到
        if (left > right) {
            return new ArrayList<Integer>();
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];
        if (findVal > midVal) { // 向 右递归
            return binarySearch2(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) { // 向左递归
            return binarySearch2(arr, left, mid - 1, findVal);
        } else {
            // * 思路分析
            // * 1. 在找到 mid 索引值,不要马上返回
            // * 2. 向 mid 索引值的左边扫描,将所有满足 1000, 的元素的下标,加入到集合 ArrayList
            // * 3. 向 mid 索引值的右边扫描,将所有满足 1000, 的元素的下标,加入到集合 ArrayList
            // * 4. 将 Arraylist 返回
            List<Integer> resIndexlist = new ArrayList<Integer>();
            //向 mid 索引值的左边扫描,将所有满足 1000, 的元素的下标,加入到集合 ArrayList
            int temp = mid - 1;
            while (true) {
                if (temp < 0 || arr[temp] != findVal) {//退出
                    break;
                }
                //否则,就 temp 放入到 resIndexlist
                resIndexlist.add(temp);
                temp -= 1; //temp 左移
            }
            resIndexlist.add(mid); //
            //向 mid 索引值的右边扫描,将所有满足 1000, 的元素的下标,加入到集合 ArrayList
            temp = mid + 1;
            while (true) {
                if (temp > arr.length - 1 || arr[temp] != findVal) {//退出
                    break;
                }
                //否则,就 temp 放入到 resIndexlist
                resIndexlist.add(temp);
                temp += 1; //temp 右移
            }
            return resIndexlist;
        }
    }

3.插值查找:

1) 插值查找原理介绍: 插值查找算法类似于二分查找,不同的是插值查找每次从自适应 mid 处开始查找。

2) 将折半查找中的求 mid 索引的公式 , low 表示左边索引 left, high 表示右边索引 right. key 就是前面我们讲的 findVal

3) int mid = low + (high - low) * (key - arr[low]) / (arr[high] - arr[low]) ;/*插值索引*/ 对应前面的代码公式: int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left])

4) 举例说明插值查找算法 1-100 的数组

具体代码实现;

//编写插值查找算法
//说明:插值查找算法,也要求数组是有序的
/**
 *
 * @param arr 数组
 * @param left 左边索引
 * @param right 右边索引
 * @param findVal 查找值
 * @return 如果找到,就返回对应的下标,如果没有找到,返回-1
 */
public static int insertValueSearch(int[] arr, int left, int right, int findVal) {
        System.out.println("插值查找次数~~");
        //注意:findVal < arr[0] 和 findVal > arr[arr.length - 1] 必须需要
        //否则我们得到的 mid 可能越界
        if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
            return -1;
        }
        // 求出 mid, 自适应
        int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
        int midVal = arr[mid];
        if (findVal > midVal) { // 说明应该向右边递归
            return insertValueSearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) { // 说明向左递归查找
            return insertValueSearch(arr, left, mid - 1, findVal);
        } else {
            return mid;
        }
}

★插值查找注意事项:

1) 对于数据量较大,关键字分布比较均匀的查找表来说,采用插值查找, 速度较快.

2) 关键字分布不均匀的情况下,该方法不一定比折半查找要好

4.斐波那契(黄金分割法)查找算法

▲基本介绍

1) 黄金分割点是指把一条线段分割为两部分,使其中一部分与全长之比等于另一部分与这部分之比。取其前三位 数字的近似值是 0.618。由于按此比例设计的造型十分美丽,因此称为黄金分割,也称为中外比。这是一个神 奇的数字,会带来意向不大的效果。

2) 斐波那契数列 {1, 1, 2, 3, 5, 8, 13, 21, 34, 55 } 发现斐波那契数列的两个相邻数 的比例,无限接近 黄金分割值 0.618

▲原理分析

        斐波那契查找原理与前两种相似,仅仅改变了中间结点(mid)的位置,mid 不再是中间或插值得到,而是位 于黄金分割点附近,即 mid=low+F(k-1)-1(F 代表斐波那契数列),如下图所示

▲ 对 F(k-1)-1 的理解: 1) 由斐波那契数列 F[k]=F[k-1]+F[k-2] 的性质,可以得到 (F[k]-1)=(F[k-1]-1)+(F[k-2]-1)+1 。该式说明: 只要顺序表的长度为 F[k]-1,则可以将该表分成长度为 F[k-1]-1 和 F[k-2]-1 的两段,即如上图所示。从而中间位置为 mid=low+F(k-1)-1

2) 类似的,每一子段也可以用相同的方式分割

3) 但顺序表长度 n 不一定刚好等于 F[k]-1,所以需要将原来的顺序表长度 n 增加至 F[k]-1。这里的 k 值只要能使 得 F[k]-1 恰好大于或等于 n 即可,由以下代码得到,顺序表长度增加后,新增的位置(从 n+1 到 F[k]-1 位置), 都赋为 n 位置的值即可。

while(n>fib(k)-1)

k++;

 ★具体代码实现:

    public class FibonacciSearch {
        public static int maxSize = 20;

        public static void main(String[] args) {
            int[] arr = {1, 8, 10, 89, 1000, 1234};
            System.out.println("index=" + fibSearch(arr, 189));// 0
        }

        //因为后面我们 mid=low+F(k-1)-1,需要使用到斐波那契数列,因此我们需要先获取到一个斐波那契数列
        //非递归方法得到一个斐波那契数列
        public static int[] fib() {
            int[] f = new int[maxSize];
            f[0] = 1;
            f[1] = 1;
            for (int i = 2; i < maxSize; i++) {
                f[i] = f[i - 1] + f[i - 2];
            }
            return f;
        }
        //编写斐波那契查找算法
        //使用非递归的方式编写算法
        /**
         * @param a   数组
         * @param key 我们需要查找的关键码(值) * @return 返回对应的下标,如果没有-1
         */
        public static int fibSearch(int[] a, int key) {
            int low = 0;
            int high = a.length - 1;
            int k = 0; //表示斐波那契分割数值的下标
            int mid = 0; //存放 mid 值
            int f[] = fib(); //获取到斐波那契数列
            //获取到斐波那契分割数值的下标
            while (high > f[k] - 1) {
                k++;
            }
            //因为 f[k] 值 可能大于 a 的 长度,因此我们需要使用 Arrays 类,构造一个新的数组,并指向 temp[]
            //不足的部分会使用 0 填充
            int[] temp = Arrays.copyOf(a, f[k]);
            //实际上需求使用 a 数组最后的数填充 temp
            //举例:
            //temp = {1,8, 10, 89, 1000, 1234, 0, 0} => {1,8, 10, 89, 1000, 1234, 1234, 1234,}
            for (int i = high + 1; i < temp.length; i++) {
                temp[i] = a[high];
            }
            // 使用 while 来循环处理,找到我们的数 key
            while (low <= high) { // 只要这个条件满足,就可以找
                mid = low + f[k - 1] - 1;
                if (key < temp[mid]) { //我们应该继续向数组的前面查找(左边)
                    high = mid - 1;
                    //为甚是 k--
                    //说明
                    //1. 全部元素 = 前面的元素 + 后边元素
                    //2. f[k] = f[k-1] + f[k-2]
                    //因为 前面有 f[k-1]个元素,所以可以继续拆分 f[k-1] = f[k-2] + f[k-3]
                    //即 在 f[k-1] 的前面继续查找 k--
                    //即下次循环 mid = f[k-1-1]-1
                    k--;
                } else if (key > temp[mid]) { // 我们应该继续向数组的后面查找(右边)
                    low = mid + 1;
                    //为什么是 k -=2
                    //说明
                    //1. 全部元素 = 前面的元素 + 后边元素
                    //2. f[k] = f[k-1] + f[k-2]
                    //3. 因为后面我们有 f[k-2] 所以可以继续拆分 f[k-1] = f[k-3] + f[k-4]
                    //4. 即在 f[k-2] 的前面进行查找 k -=2
                    //5. 即下次循环 mid = f[k - 1 - 2] - 1
                    k -= 2;
                } else { //找到
                    //需要确定,返回的是哪个下标
                    if (mid <= high) {
                        return mid;
                    } else {
                        return high;
                    }
                }
            }
            return -1;
        }
    }
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值