查找算法
1、查找算法
常用的查找算法有:
- 顺序(线性)查找
- 二分查找/折半查找
- 插值查找
- 斐波那契(黄金分割)查找
1.1、线性查找算法
- 线性查找的数列可以是有序的,也可以是无序的。
- 有一个数列: {1, 9, 11, -1, 34, 89},判断数列中是否包含待查找的数值。要求:如果找到了,就提示找到,并给出待查找值的下标值。
public class SeqSearch {
public static void main(String[] args) {
int arr[] = {1, 9, 11, -1, 34, 89}; //无序的数组
int index = seqSearch(arr, 11);
if (index == -1) {
System.out.println("没有找到");
} else {
System.out.println("找到,下标为" + index);
}
}
/**
* 线性查找算法
* 这里实现的线性查找是只要找到一个满足条件的值,就返回其下标值
* 也就是说 默认数组是不重复的
* 找到即返回其下标值,未找到返回-1
*
* @param arr 待查找的数组
* @param value 待查找的值
* @return 待查找值在数组中的下标值
*/
public static int seqSearch(int[] arr, int value) {
//线性查找是逐一比对,发现有相同值,就返回下标值
for (int i = 0; i < arr.length; i++) {
if (arr[i] == value) {
return i;
}
}
return -1;
}
}
- 数组重复{1, 9, 89, 11, -1, 89, 34, 89, 9},要求查找到全部符合条件的值。
import java.util.ArrayList;
public class SeqSearch2 {
public static void main(String[] args) {
int arr[] = {1, 9, 89, 11, -1, 89, 34, 89, 9}; //无序的重复数组
ArrayList<Integer> arrayList = seqSearch2(arr, 89);
if (arrayList.isEmpty()) {
System.out.println("没有找到");
} else {
System.out.println("找到,下标为" + arrayList);
}
}
/**
* 线性查找算法
* 这里实现的线性查找是要求找到重复数组中,所有符合条件值的下标
* 找到即返回其下标集合,未找到返回空集合
*
* @param arr 待查找的数组
* @param value 待查找的值
* @return 待查找值在数组中的下标值集合
*/
public static ArrayList<Integer> seqSearch2(int[] arr, int value) {
ArrayList<Integer> arrayList = new ArrayList<>();
//线性查找是逐一比对,发现有相同值,就返回下标值
for (int i = 0; i < arr.length; i++) {
if (arr[i] == value) {
arrayList.add(i);
}
}
return arrayList;
}
}
1.2、二分查找/折半查找算法
- 二分查找要求在一个有序数组中才可以使用。如果是无序数组,可以先进行排序,再进行二分查找。
- 对有序数组{1, 8, 10, 89, 1000, 1234}进行二分查找,输入一个数看看该数组是否存在此数,并求出其下标,如果不存在则提示"没有找到"。
二分查找的思路分析:
- 首先确定该数组的中间下标
mid = ( left + right ) / 2- 然后让需要查找的数findVal和arr[mid]进行比较
2.1 findVal > arr[mid],说明你要查找的数在mid的右边,因此需要向右递归的查找。
2.2 findVal < arr[mid],说明你要查找的数在mid的左边,因此需要向左递归的查找。
2.3 findVal == arr[mid],说明找到,就返回。// 什么时候我们结束递归?
- 找到就结束递归。
- 递归完整个数组,仍然没有找到findVal,此时也需要结束递归,条件判断可写为,当left > right ,就结束递归。
public class BinarySearch {
public static void main(String[] args) {
//注意:使用二分查找的前提,必须要求数组是有序的。
int arr[] = {1, 8, 10, 89, 1000, 1234}; //无重复的数组
int index = binarySearch(arr, 0, arr.length, 1000);
if (index == -1) {
System.out.println("没有找到");
} else {
System.out.println("找到,下标为" + index);
}
}
//二分查找算法
/**
* @param arr 数组
* @param left 左边的索引
* @param right 右边的索引
* @param findVal 要查找的值
* @return 如果找到就返回下标,如果没有找到,就返回-1
*/
public static int binarySearch(int[] arr, int left, int right, int findVal) {
//当 left > right ,说明已经递归完整个数组,但仍然没有找到
if (left > right) {
return -1;
}
int mid = (left + right) / 2;
int midVal = arr[mid];
if (findVal > midVal) { //向右进行递归
return binarySearch(arr, mid + 1, right, findVal);
} else if (findVal < midVal) { //向左进行递归
return binarySearch(arr, left, mid - 1, findVal);
} else { //找到,返回下标值
return mid;
}
}
}
- {1, 8, 10, 89, 1000, 1234},当一个有序数组中,有多个相同的数组时,如何将所有的数组都找到并返回其下标,比如这里的1000。
思路分析:
- 在找到mid 索引值时,不要马上返回。
- 向mid 索引值的左边进行扫描,将左边所有满足条件(这里指1000)的元素的下标,加入到ArrayList集合中。
- 向mid 索引值的右边进行扫描,将右边所有满足条件(这里指1000)的元素的下标,加入到ArrayList集合中。
- 将ArrayList集合返回
public class BinarySearch2 {
public static void main(String[] args) {
//注意:使用二分查找的前提,必须要求数组是有序的。
int arr[] = {1, 8, 10, 89, 1000, 1000,1000, 1000, 1234};
ArrayList<Integer> arrayList = binarySearch2(arr, 0, arr.length, 1000);
if (arrayList.isEmpty()) {
System.out.println("没有找到");
} else {
System.out.println("找到,下标为" + arrayList);
}
}
//二分查找算法
/**
* @param arr 数组
* @param left 左边的索引
* @param right 右边的索引
* @param findVal 要查找的值
* @return 如果找到就返回arrayList集合,如果没有找到,就返回空集合
*/
public static ArrayList<Integer> binarySearch2(int[] arr, int left, int right, int findVal) {
ArrayList<Integer> arrayList = new ArrayList<>();
//当 left > right ,说明已经递归完整个数组,但仍然没有找到
if (left > right) {
return arrayList;
}
int mid = (left + right) / 2;
int midVal = arr[mid];
if (findVal > midVal) { //向右进行递归
return binarySearch2(arr, mid + 1, right, findVal);
} else if (findVal < midVal) { //向左进行递归
return binarySearch2(arr, left, mid - 1, findVal);
} else {
//找到mid,先加入到arrayList中
arrayList.add(mid);
// 在找到mid 索引值时,不要马上返回。
// 向mid 索引值的左边进行扫描,将左边所有满足条件(这里指1000)的元素的下标,加入到ArrayList集合中。
int temp = mid - 1;
while (true) {
//这里的判断条件:
//temp < 0 即向左扫描完所有,break跳出循环
//或者 当找到的值不等于待查找的值时,break,因为是有序数组,所以只要不查找到不等于即可
if (temp < 0 || arr[temp] != findVal) {
break;
}
//否则,就将temp放入到集合中
arrayList.add(temp);
temp -= 1; //temp 左移
}
// 向mid 索引值的右边进行扫描,将右边所有满足条件(这里指1000)的元素的下标,加入到ArrayList集合中。
temp = mid + 1;
while (true) {
if (temp > arr.length - 1 || arr[temp] != findVal) {
break;
}
arrayList.add(temp);
temp += 1;
}
// 将ArrayList集合返回
return arrayList;
}
}
}
1.3、插值查找算法
- 插值查找原理介绍:
插值查找算法类似于二分查找,不同的是插值查找每次从自适应的mid处开始查找。 - 将二分查找中求mid 索引的公式改成以下公式,left 表示左边索引,right 表示右边索引,findVal 表示要查找的值。
用代码表示为:
- 插值查找注意事项:
3.1 对于数据量较大,关键字分布比较均匀的查找表来说,采用插值查找,速度较快。
3.2 关键字分布不均匀的情况下,该方法不一定比二分查找要好。 - 插值查找案例:
请对一个 1 ~ 100 的有序数组进行插值查找,输入一个数看看该数组是否存在此数,并求出其下标,若不存在,则提示"没有找到"。
public class InsertValueSearch {
public static void main(String[] args) {
int[] arr = new int[100];
for (int i = 0; i < 100; i++) {
arr[i] = i + 1;
}
int index = insertValSearch(arr, 0, arr.length - 1, 55);
if (index == -1) {
System.out.println("没有找到");
} else {
System.out.println("找到,下标为:" + index);
}
}
//插值查找算法
//说明:插值查找算法也要求数组是有序的
public static int insertValSearch(int arr[], int left, int right, int findVal) {
//注意:findVal < arr[0] 和 findVal > arr[arr.length - 1] 必须需要
//否则,我们得到的mid可能越界
if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
return -1;
}
//求出插值查找的自适应mid
int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
int midVal = arr[mid];
if (findVal > midVal) { //向右边递归扫描
return insertValSearch(arr, mid + 1, right, findVal);
} else if (findVal < midVal) {
return insertValSearch(arr, left, mid - 1, findVal);
} else {
return mid;
}
}
}
1.4、斐波那契(黄金分割法)查找算法
- 斐波那契(黄金分割法)查找基本介绍:
1)黄金分割点是指把一条线段分割为两部分,使其中一部分与全长之比等于另一部分与这一部分之比。取其前三位数字的近似值是0.618。
2)斐波那契数列{1, 1, 2, 3, 5, 8, 13, 21, 34, 55},发现斐波那契数列的两个相邻数的比例 ,无限接近黄金分割值0.618。 - 斐波那契原理:
斐波那契查找原理与二分查找、插值查找两种相似,仅仅改变了中间结点(mid)的位置,mid不再是中间或插值得到的位置,而是位于黄金分割点附近,即 mid = low + F(k-1) - 1 (F代表斐波那契数列),如下图所示:
对F(k-1)-1的理解:
- 由斐波那契数列F[K] = F[K-1] + F[K-2]的性质,可以得到
(F[k] -1) = (F[k-1] -1) + (F[k-2] -1) + 1。该式说明:只要顺序表的长度为F[k] - 1,则可以将该表分成长度为F[k-1] - 1 和 F[k-2] - 1 的两段,即如上图。从而中间位置为mid = low + F[k-1] - 1。- 类似的,每一段字段也可以用相同的方式分割。
- 但顺序表长度n不一定刚好等于F[k] - 1,所以需要将原来的顺序表长度n增加至F[k] - 1。这里的k值只要能使得F[k] - 1恰好大于或者等于 n 即可,由以下代码得到,顺便表长度增加后,新增的位置(从n+1 到F[k] - 1位置)都赋值为n位置的值即可。
while(n > fib(k) - 1){
k++;
}
- 斐波那契查找案例:
请对一个有序数组进行斐波那契查找{1, 8, 10, 89, 1000, 1234},输入一个数看看该数组是否存在此数,并且求出下标,如果没有就提示"没有找到"。
import java.util.Arrays;
public class FibonacciSearch {
public static void main(String[] args) {
int[] arr = {1, 8, 10, 89, 1000, 1234};
int index = fibSearch(arr, 1234);
if (index == -1) {
System.out.println("没有找到");
} else {
System.out.println("找到,下标为:" + index);
}
}
//因为后面 mid = low + F(k-1) - 1,需要使用到斐波那契数列,因此我们需要先获取到一个斐波那契数列
//非递归方法得到一个斐波那契数列
public static int[] fib() {
int maxSize = 20;
int[] f = new int[maxSize];
f[0] = 1;
f[1] = 1;
for (int i = 2; i < maxSize; i++) {
f[i] = f[i - 1] + f[i - 2];
}
return f;
}
//使用非递归的方式编写斐波那契查找算法
public static int fibSearch(int[] arr, int findVal) {
int low = 0;
int high = arr.length - 1;
int k = 0; //表示斐波那契分割数值的下标
int mid = 0; //存放mid值
int f[] = fib(); //获取到斐波那契数列
//获取到斐波那契分割数值的下标
while (high > f[k] - 1) {
k++;
}
//因为 f[k] 值可能大于arr的长度,因此我们需要使用Arrays类,构造一个新的数组,并指向temp[]
//不足的部分Arrays类会自动用0补充
int[] temp = Arrays.copyOf(arr, f[k]);
//实际上需要使用arr数组的最后一个数值补充temp空余部分
//例如:
//temp = {1, 8, 10, 89, 1000, 1234, 0, 0} => {1, 8, 10, 89, 1000, 1234, 1234, 1234};
for (int i = high + 1; i < temp.length; i++) {
temp[i] = arr[high];
}
//使用while来循环处理,找到我们要找的数findVal
while (low <= high) { //只要满足这个条件,就可以继续查找
mid = low + f[k - 1] - 1;
if (findVal < temp[mid]) { //应该继续往数组的前面查找(左边)
high = mid - 1;
//为什么是k--?
//说明:
//1. 全部元素 = 前面的元素 + 后面的元素
//2. f[k] = f[k-1] + f[k-2]
//因为前面有f[k-1]个元素,所以可以继续拆分为 f[k-1] = f[k-2] + f[k-3]
//即下次循环mid = f[k-1-1]-1;
k--;
} else if (findVal > temp[mid]) {
low = mid + 1;
//为什么是k-=2?
//说明:
//1. 全部元素 = 前面的元素 + 后面的元素
//2. f[k] = f[k-1] + f[k-2]
//因为后面有f[k-2]个元素,所以可以继续拆分为 f[k-2] = f[k-3] + f[k-4]
//即下次循环mid = f[k-1-2]-1;
k -= 2;
} else { //找到
//需要确定返回哪个下标
if (mid <= high) {
return mid;
} else {
return high;
}
}
}
return -1;
}
}
2、排序算法
2.1、堆排序
2.1.1、堆排序基本介绍
1)堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好平均时间复杂度均为O(nlogn),它也是不稳定排序。
2)堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆。注意:没有要求结点的左孩子的值和右孩子的值的大小关系。
3)每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。
4)大顶堆举例说明:
5)小顶堆举例说明:
6)一般升序采用大顶堆,降序采用小顶堆(采用堆后会进行排序比较)
2.1.2、堆排序的基本思想
堆排序的基本思想是:
- 将待排序序列构造成一个大顶堆
- 此时,整个序列的最大值就是堆顶的根节点。
- 将其与末尾元素进行交换,此时末尾就为最大值。
- 然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了。
2.1.3、堆排序步骤图解说明
要求:给你一个数组{4,6,8,5,9},要求使用堆排序法,将数组升序排序。
步骤一:构造初始堆。
将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。原始的数组[4,6,8,5,9]。
- 假设给定无序序列结构如下:
- 此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点下标为arr.length/2-1=5/2-1=1,也就是下面的6结点),从左至右,从下至上进行调整。
- 找到第二个非叶节点4,由于[4,9,8]中9元素最大,4和9交换。
- 这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6最大,交换4和6。
此时,我们就将一个无序序列构造成了一个大顶堆。
步骤二:将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。
- 将堆顶元素9和末尾元素4进行交换。
- 重新调整树结构,使其继续满足堆定义。
- 再将堆顶元素8与末尾元素5进行交换,得到第二大元素8。
4. 后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序。
再简单总结下堆排序的基本思路:
- 将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;
- 将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
- 重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。
2.1.4、堆排序代码实现
要求:给你一个数组{4,6,8,5,9},要求使用堆排序法,将数组升序排序。
代码实现:
import java.util.Arrays;
public class HeapSort {
//测试堆排序
public static void main(String[] args) {
int arr[] = {4, 6, 8, 5, 9, 10, 99, -1, -4};
heapSort(arr);
System.out.println(Arrays.toString(arr));
}
//编写一个堆排序的方法
public static void heapSort(int arr[]) {
int temp = 0;
System.out.println("堆排序");
//堆排序算法代码:
//1. 将一个无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆
for (int i = arr.length / 2 - 1; i >= 0; i--) {
adjustHeap(arr, i, arr.length);
}
//2. 将堆顶元素与末尾元素交换,将最大元素“沉”到数组末端
//3. 重新调整树结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换,直到整个序列有序
for (int i = arr.length - 1; i > 0; i--) {
//交换
temp = arr[i];
arr[i] = arr[0];
arr[0] = temp;
adjustHeap(arr, 0, i);
}
}
//将一个数组(顺序存储的二叉树),调整成一个大顶堆(升序排序用大顶堆,降序用小顶堆)
/**
* 作用:完成将以 i 对应的非叶子结点的树调整成大顶堆
*
* @param arr 待调整的数组
* @param i 表示非叶子结点在数组中的索引
* @param length 表示对多少个元素进行调整,因为length会随着最大值和最小值的交换而减小
*/
public static void adjustHeap(int arr[], int i, int length) {
int temp = arr[i]; //先取出当前非叶子结点的值,保存在临时变量中
//开始调整
//说明:
//k = i * 2 + 1 表示k是i结点的左子结点
for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {
if (k + 1 < length && arr[k] < arr[k + 1]) { //说明左右子结点存在,且左子结点的值小于右子结点的值
k++; //k指向右子结点
}
if (arr[k] > temp) { //如果子结点大于父结点
arr[i] = arr[k]; //把较大的值赋给当前的非叶子结点
i = k; //!!! i指向k
}
}
//当for循环结束后,我们已经将以i为父结点的树的最大值放在了顶部
arr[i] = temp; //将temp值放到调整后的位置
}
}
结果如下: