Java基础篇1-二分查找算法与排序算法
1.二分查找
1.1什么是二分查找?
二分查找(Binary Search)也叫作折半查找。二分查找有两个要求,一个是数列有序,另一个是数列使用顺序存储结构(比如数组)。
JQ:先进行排序,然后找中间值,然后比较查询的值与中间值得大小,确定搜索范围,然后进行一次折半查找
1.2 二分查找代码编写
代码编写步骤:
-
前提:有已排序数组 A(假设已经做好)
-
定义左边界 L、右边界 R,确定搜索范围,循环执行二分查找(3、4两步)
-
获取中间索引 M = Floor((L+R) /2)
-
中间索引对应的值 A[M] 与待搜索的值T 进行比较
① A[M] == T 表示找到,返回中间索引
② A[M] > T,中间值右侧的其它元素都大于 T,无需比较,中间索引左边去找,M - 1 设置为右边界,重新查找
③ A[M] < T,中间值左侧的其它元素都小于 T,无需比较,中间索引右边去找, M + 1 设置为左边界,重新查找
-
当 L > R 时,表示没有找到,应结束循环
算法代码
public static int binarySearch(int[] a, int t) {
int l = 0, r = a.length - 1, m;
while (l <= r) {
m = (l + r) / 2;
if (a[m] == t) {
return m;
} else if (a[m] > t) {
r = m - 1;
} else {
l = m + 1;
}
}
return -1;
}
测试代码
public static void main(String[] args) {
int[] array = {1, 5, 8, 11, 19, 22, 31, 35, 40, 45, 48, 49, 50};
int target = 47;
int idx = binarySearch(array, target);
System.out.println(idx);
}
1.3获取间索引时,如何避免整数溢出
原因:当L和R都特别大时,L+R就可能超出整数范围
两种解决方式:
-
M= (L+R) /2 换种表示
M=((L+R) /2=L-L/2+R/2=L+(-L/2+R/2)=L+(R-L)/2 -
利用右移方式计算代替除法
((L+R) /2–》 ((L+R) >>>1
1.3二分查找其他考法
其它考法
- 有一个有序表为 1,5,8,11,19,22,31,35,40,45,48,49,50 当二分查找值为 48 的结点时,查找成功需要比较的次数
- 使用二分法在序列 1,4,6,7,15,33,39,50,64,78,75,81,89,96 中查找元素 81 时,需要经过( )次比较
- 在拥有128个元素的数组中二分查找一个数,需要比较的次数最多不超过多少次
对于前两个题目,记得一个简要判断口诀:
- 奇数二分取中间
- 偶数二分取中间靠左
对于后一道题目,需要知道公式:
n = l o g 2 N = l o g 10 N / l o g 10 2 n = log_2N = log_{10}N/log_{10}2 n=log2N=log10N/log102
- 如果计算结果是整数,则该整数为最终结果
- 如果计算结果为小数,则舍去小数,整数加一为最终结果
其中 n 为查找次数,N 为元素个数
2.排序算法
2.0Comparable接口介绍
由于我们这里要讲排序,所以肯定会在元素之间进行比较,而Java提供了一个接口Comparable就是用来定义排序规则的,在这里我们以案例的形式对Comparable接口做一个简单的回顾。
需求:
- 定义一个学生类Student,具有年龄age和姓名username两个属性,并通过Comparable接口提供比较规则;
- 定义测试类Test,在测试类Test中定义测试方法Comparable getMax(Comparable c1,Comparable c2)完成测试
package cn.itcast.algorithm.sort;
//1.定义一个学生类Student,具有年龄age和姓名username两个属性,并通过Comparable接口提供比较规则;
public class Student implements Comparable<Student>{
private String username;
private int age;
public String getUsername() {
return username;
}
public void setUsername(String username) {
this.username = username;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public String toString() {
return "Student{" +
"username='" + username + '\'' +
", age=" + age +
'}';
}
@Override
public int compareTo(Student o) {
return this.getAge()-o.getAge();
}
}
测试代码
package cn.itcast.algorithm.test;
import cn.itcast.algorithm.sort.Student;
//2.定义测试类Test,在测试类Test中定义测试方法Comparable getMax(Comparable c1,Comparable c2)完成测试
public class TestComparable {
public static void main(String[] args) {
//创建两个Student对象,并调用getMax方法,完成测试
Student s1 = new Student();
s1.setUsername("张三");
s1.setAge(18);
Student s2 = new Student();
s2.setUsername("李四");
s2.setAge(20);
Comparable max = getMax(s1, s2);
System.out.println(max);
}
public static Comparable getMax(Comparable c1,Comparable c2){
int result = c1.compareTo(c2);
//如果result<0,则c1比c2小;
//如果result>0,则c1比c2大;
//如果result==0,则c1和c2一样大;
if (result>=0){
return c1;
}else{
return c2;
}
}
}
2.1冒泡排序
2.1.1图解冒泡排序(写代码)
相邻元素比较
- value(t)<value(t+1),则位置不变
- value(t)>value(t+1),交换t与t+1 位置对应的值
2.1.2冒泡排序代码实现
import java.util.Arrays;
public class Main {
public static void main(String[] args) {
int [] array={5,9,7,4,1,3,2,8};
bubbleSort(array);
}
public static void bubbleSort(int[]a){
for(int j=0;j<a.length-1;j++){
// 一轮冒泡
for (int i=0 ; i<a.length-1;i++){
if (a[i]>a[i+1]){
swap(a,i,i+1);
}
}
}
System.out.println(Arrays.toString(a));
}
public static void swap(int [] a ,int i,int j){
int temp=a[i];
a[i]=a[j];
a[j]=temp;
}
}
2.1.3冒泡排序代码优化
优化方案1 经过第一轮的循环后,最大元素无需再与前面的元素比较,减少内层循环次数
import java.util.Arrays;
public class Main {
public static void main(String[] args) {
int [] array={5,9,7,4,1,3,2,8};
bubbleSort(array);
}
public static void bubbleSort(int[]a){
for(int j=0;j<a.length-1;j++){
// 一轮冒泡
for (int i=0 ; i<a.length-1-j;i++){
if (a[i]>a[i+1]){
swap(a,i,i+1);
}
}
}
System.out.println(Arrays.toString(a));
}
public static void swap(int [] a ,int i,int j){
int temp=a[i];
a[i]=a[j];
a[j]=temp;
}
}
优化方案2 减少不必要的冒泡次数,判断什么时候已经有序了,如果一次循环过后,没有发生位置交换,则数组已经有序了
import java.util.Arrays;
public class Main {
public static void main(String[] args) {
int [] array={5,9,7,4,1,3,2,8};
bubbleSort(array);
}
public static void bubbleSort(int[]a){
boolean swapped=false;// 数组中元素是否发生了位置交换
for(int j=0;j<a.length-1;j++){
// 一轮冒泡
for (int i=0 ; i<a.length-1-j;i++){
if (a[i]>a[i+1]){
swap(a,i,i+1);
swapped=true;
}
}
if(!swapped){
break;
}
}
System.out.println(Arrays.toString(a));
}
public static void swap(int [] a ,int i,int j){
int temp=a[i];
a[i]=a[j];
a[j]=temp;
}
}
优化方案3 记录最后一次交换位置时的索引,作为下一次循环的次数
public static void bubbleSort2(int [] a){
int n=a.length-1;
while(true){
int last=0; // 表示最后一次交换索引时的位置
for(int i=0;i<n;i++){
if(a[i]>a[i+1]){
swap(a,i,i+1);
last=i;
}
}
n=last;
if(n==0){
break;
}
System.out.println(Arrays.toString(a));
}
}
2.1.4冒泡排序总结(以升序为例)
- 依次比较数组中相邻两个元素大小,若a[j]>a[j+1],则交换两个元素,两两都比较一遍成为一轮冒泡,结果是让最大的元素排至最后
- 重读以上步骤,直到整个数组有序
- 优化方式:每轮冒泡时,最后一次交换索引可以作为下一次冒泡的比较次数,如果这个值为零,表示整个数组有序,直接退出外层循环即可。
2.2 选择排序(写代码)
2.2.1图解选择排序
寻找数组中最小的元素,假设最小元素位置在0 ,与其他元素比较,找到最小的,并与其交换位置
2.2.2选择排序代码实现
public staatic void selection(int[]a){
for(int i=0;i<a.length-1;i++){
//i 代表每轮循环最小元素要交换的目标位置索引
int s=i; //s表示最小元素所在位置的索引
for(int j=s+1;j<a.length;j++){
if(a[s]>a[j]){
s=j;
}
}
if(s!=i){
swap(a,s,i);
}
}
}
public static void swap(int[] a ,int i,int j){
int temp=a[i];
a[i]=a[j];
a[j]=temp;
}
2.2.3选择排序总结(以升序为例)
- 将数组分为两个子集,排序的和未排序的,每一轮从未排序的子集中选出最小的元素,放入排序的子集
- 重复以上步骤,直到整个数组有序
- 优化:为减少交换次数,每一轮可以先找最小的索引,在每轮的最后再交换元素。
2.3冒泡排序与选择排序比较
- 二者平均时间复杂度都是O(n^2)
- 选择排序一般要快于冒泡排序,因为交换次数少
- 但如果集合有序度高,冒泡优于选择
- 冒泡属于稳定排序算法,而选择属于不稳定排序
2.4插入排序
2.4.1图解插入排序
假定第t个元素是有序的,则与t+1元素比较,并将t+1的元素 与t+1前元素比较并插入合适的位置
2.4.2插入排序代码实现
public static void insert(int[]a){
for(int i=1;i<a.length;i++){
//i 代表待插入元素的索引
int temp=a[i]; // 代表待插入的元素值
int j=i-1; //代表已排序区域的元素索引
while(j>=0){
if(temp<a[j]){
a[j+1]=a[j];
}else{
break;
}
j--;
}
a[j+1]=temp;
}
}
2.4.3优化方式
- 带插入元素进行比较时,遇到比自己小的元素,就代表找到了插入位置,无需进行后续比较
- 插入时,可以直接移动元素,而不是交换元素
2.4.4插入排序总结
- 将数组分为两个区域,排序区域和未排序区域,每一轮从未排序区域中取出第一个元素,插入到排序区域(需要保证顺序)、
- 重读以上步骤,直到整个数组有序
2.5插入排序与选择排序比较
- 二者平均时间复杂度都是O(n^2)
- 大部分情况下,插入都略优于选择排序
- 有序集合插入的时间复杂度为O(n)
- 插入排序属于稳定排序算法,选择排序属于不稳定排序
2.6希尔排序(掌握思路)
-
首先选取一个间隙序列,如 (n/2,n/4 … 1),n 为数组长度
-
每一轮将间隙相等的元素视为一组,对组内元素进行插入排序,目的有二
① 少量元素插入排序速度很快
② 让组内值较大的元素更快地移动到后方
-
当间隙逐渐减少,直至为 1 时,即可完成排序
2.7快速排序
2.7.1图解快速排序
分区,选取一个基准点,比基准点大的元素放在基准点的右边,比基准点小的元素放在基准点的左边
2.7.2快速排序文字描述
- 每一轮排序选择一个基准点(pivot)进行分区
让小于基准点的元素的进入一个分区,大于基准点的元素的进入另一个分区
当分区完成时,基准点元素的位置就是其最终位置 - 在子分区内重复以上过程,直至子分区元素个数少于等于 1,这体现的是分而治之的思想 (divide-and-conquer)
- 从以上描述可以看出,一个关键在于分区算法,常见的有洛穆托分区方案、双边循环分区方案、霍尔分区方案
2.7.3快速排序实现方式1-单边循环快排(洛穆托分区方案)*
- 选择最右元素作为基准点元素
- j指针负责找到比基准点小的元素,一旦找到则与i进行交换
- i指针维护小于基准点元素的边界,也是每次交换的目标索引
- 最后基准点与i交换,i即为分区位置
public static void main(String[] args) {
int [] array={5,3,7,2,9,8,1,4};
// partition(array,0,array.length-1);
quick(array,0,array.length-1);
}
public static void quick(int[]a,int l,int h){
if(l>=h){
return;
}
int p=partition(a,l,h);
//递归实现
quick(a,l,p-1); //左侧分区的确定范围
quick(a,p+1,h); //右侧分区的确定范围
}
public static int partition(int[]a,int l,int h){
int pv=a[h]; //基准点元素
int i=l;
for(int j=l;j<h;j++){
if(a[j]<pv){
if(i!=j){
swap(a,i,j);
}
i++;
}
}
//基准元素与i交换
if(i!=h){
swap(a,h,i);
}
System.out.println(Arrays.toString(a));
// 返回值代表基准点元素所在的正确索引,用它确定下一轮分区的边界
return i;
}
public static void swap(int[] a ,int i,int j){
int temp=a[i];
a[i]=a[j];
a[j]=temp;
}
2.7.4快速排序实现方式2-双边循环快排(并不完全等价于hoare分区方案)
- 选择最左边的元素作为基准点
- j指针负责从右→左找比基准点小的元素;i指针负责从左→右寻找比基准点大的元素,一旦找到二者交换位置,直至i,j相交
- 最后基准点与i(此时i与j相等)交换,i即为分区位置
public static void quick(int[]a,int l,int h){
if(l>=h){
return;
}
int p=partition(a,l,h);
// p 基准点的索引值
quick(a,l,p-1);//左边分区的范围确定
quick(a,p+1,h);//右边分区的范围确定
}
public static int binPartition(int[]a,int l,int h){
int pv=a[l];
int i=l;
int j=h;
while(i<j){
//j从右往左找小的
while(i<j&&a[j]>pv){
j--;
}
//i从左网右找大的
while(i<j&&a[i]<=pv){
i++;
}
swap(a,i,j);
}
swap(a,l,j);
System.out.println(Arrays.toString(a));
return j;
}
public static void swap(int[] a ,int i,int j){
int temp=a[i];
a[i]=a[j];
a[j]=temp;
}
2.7.5 快速排序特点
- 平均时间复杂度 O ( n l o g 2 n ) O(nlog_2n ) O(nlog2n),最坏时间复杂度 O ( n 2 ) O(n^2) O(n2)
- 数据量较大时,优势非常明显
- 属于不稳定排序
- 霍尔的移动次数平均来讲比洛穆托少3倍
2.8归并排序
2.8.1 递归
正式学习归并排序之前,我们得先学习一下递归算法。
定义:
定义方法时,在方法内部调用方法本身,称之为递归
public void show(){
System.out.println("aaaa");
show();
}
作用:
它通常把一个大型复杂的问题,层层转换为一个与原问题相似的,规模较小的问题来求解。递归策略只需要少量的程序就可以描述出解题过程所需要的多次重复计算,大大地减少了程序的代码量。
注意事项:
在递归中,不能无限制的调用自己,必须要有边界条件,能够让递归结束,因为每一次递归调用都会在栈内存开辟新的空间,重新执行方法,如果递归的层级太深,很容易造成栈内存溢出。
需求:
请定义一个方法,使用递归完成求N的阶乘;
分析:
1!: 1
2!: 2*1=2*1!
3!: 3*2*1=3*2!
4!: 4*3*2*1=4*3!
...
n!: n*(n-1)*(n-2)...*2*1=n*(n-1)!
所以,假设有一个方法factorial(n)用来求n的阶乘,那么n的阶乘还可以表示为n*factorial(n-1)
代码实现:
package cn.itcast.algorithm.test;
public class TestFactorial {
public static void main(String[] args) {
//求N的阶乘
long result = factorial(100000);
System.out.println(result);
}
//求n的阶乘
public static long factorial(int n){
if (n==1){
return 1;
}
return n*factorial(n-1);
}
}
2.8.2归并排序
归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
需求:
排序前:{8,4,5,7,1,3,6,2}
排序后:{1,2,3,4,5,6,7,8}
排序原理:
- 尽可能的一组数据拆分成两个元素相等的子组,并对每一个子组继续拆分,直到拆分后的每个子组的元素个数是1为止。
- 将相邻的两个子组进行合并成一个有序的大组;
- 不断的重复步骤2,直到最终只有一个组为止。
归并排序API设计:
归并原理:
归并排序代码实现:
package cn.itcast.algorithm.sort;
public class Merge {
//归并所需要的辅助数组
private static Comparable[] assist;
/*
比较v元素是否小于w元素
*/
private static boolean less(Comparable v, Comparable w) {
return v.compareTo(w)<0;
}
/*
数组元素i和j交换位置
*/
private static void exch(Comparable[] a, int i, int j) {
Comparable t = a[i];
a[i] = a[j];
a[j] = t;
}
/*
对数组a中的元素进行排序
*/
public static void sort(Comparable[] a) {
//1.初始化辅助数组assist;
assist = new Comparable[a.length];
//2.定义一个lo变量,和hi变量,分别记录数组中最小的索引和最大的索引;
int lo=0;
int hi=a.length-1;
//3.调用sort重载方法完成数组a中,从索引lo到索引hi的元素的排序
sort(a,lo,hi);
}
/*
对数组a中从lo到hi的元素进行排序
*/
private static void sort(Comparable[] a, int lo, int hi) {
//做安全性校验;
if (hi<=lo){
return;
}
//对lo到hi之间的数据进行分为两个组
int mid = lo+(hi-lo)/2;// 5,9 mid=7
//分别对每一组数据进行排序
sort(a,lo,mid);
sort(a,mid+1,hi);
//再把两个组中的数据进行归并
merge(a,lo,mid,hi);
}
/*
对数组中,从lo到mid为一组,从mid+1到hi为一组,对这两组数据进行归并
*/
private static void merge(Comparable[] a, int lo, int mid, int hi) {
//定义三个指针
int i=lo;
int p1=lo;
int p2=mid+1;
//遍历,移动p1指针和p2指针,比较对应索引处的值,找出小的那个,放到辅助数组的对应索引处
while(p1<=mid && p2<=hi){
//比较对应索引处的值
if (less(a[p1],a[p2])){
assist[i++] = a[p1++];
}else{
assist[i++]=a[p2++];
}
}
//遍历,如果p1的指针没有走完,那么顺序移动p1指针,把对应的元素放到辅助数组的对应索引处
while(p1<=mid){
assist[i++]=a[p1++];
}
//遍历,如果p2的指针没有走完,那么顺序移动p2指针,把对应的元素放到辅助数组的对应索引处
while(p2<=hi){
assist[i++]=a[p2++];
}
//把辅助数组中的元素拷贝到原数组中
for(int index=lo;index<=hi;index++){
a[index]=assist[index];
}
}
}
2.9排序的稳定性
稳定性的定义:
数组arr中有若干元素,其中A元素和B元素相等,并且A元素在B元素前面,如果使用某种排序算法排序后,能够保证A元素依然在B元素的前面,可以说这个该算法是稳定的。
稳定性的意义:
如果一组数据只需要一次排序,则稳定性一般是没有意义的,如果一组数据需要多次排序,稳定性是有意义的。例如要排序的内容是一组商品对象,第一次排序按照价格由低到高排序,第二次排序按照销量由高到低排序,如果第二次排序使用稳定性算法,就可以使得相同销量的对象依旧保持着价格高低的顺序展现,只有销量不同的对象才需要重新排序。这样既可以保持第一次排序的原有意义,而且可以减少系统开销。
第一次按照价格从低到高排序:
第二次按照销量进行从高到低排序:
常见排序算法的稳定性:
冒泡排序:
只有当arr[i]>arr[i+1]的时候,才会交换元素的位置,而相等的时候并不交换位置,所以冒泡排序是一种稳定排序算法。
选择排序:
选择排序是给每个位置选择当前元素最小的,例如有数据{5(1),8 ,5(2), 2, 9 },第一遍选择到的最小元素为2,所以5(1)会和2进行交换位置,此时5(1)到了5(2)后面,破坏了稳定性,所以选择排序是一种不稳定的排序算法。
插入排序:
比较是从有序序列的末尾开始,也就是想要插入的元素和已经有序的最大者开始比起,如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的,那么把要插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。
希尔排序:
希尔排序是按照不同步长对元素进行插入排序 ,虽然一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以希尔排序是不稳定的。
归并排序:
归并排序在归并的过程中,只有arr[i]<arr[i+1]的时候才会交换位置,如果两个元素相等则不会交换位置,所以它并不会破坏稳定性,归并排序是稳定的。
快速排序:
快速排序需要一个基准值,在基准值的右侧找一个比基准值小的元素,在基准值的左侧找一个比基准值大的元素,然后交换这两个元素,此时会破坏稳定性,所以快速排序是一种不稳定的算法。