1快速排序思想
1.1快速排序思想
快排主要通过选择一个关键值作为基准值。比基准值小的都在左边序列(一般是无序的),比基准值大的都在右边(一般是无序的)。依次递归,达到总体待排序序列都有序。
1.2快速排序算法描述
选择基准:在待排序列中,按照某种方式挑出一个元素,作为“基准”。
分割操作:以该基准在序列中的位置,把序列分成两个子序列。此时,在基准左边的元素都比该基准小,在基准右边的元素都比该机准大。
递归对两个序列进行快速排序,直到序列为空或者只有一个元素。
1.3快速排序代码实现
private static<T extends Comparable<T>> int partition(T[] arr,int low,int high){
T temp = arr[low];
while(low<high){
while(low<high && arr[high].compareTo(temp)>0){
high--;
}
if(low==high){
break;
}else{
arr[low]=arr[high];
}
while (low < high && arr[low].compareTo(temp)<=0) {
low++;
}
if(low==high){
break;
}else{
arr[high]=arr[low];
}
}
arr[low]=temp;
return low;
}
private static<T extends Comparable<T>> void quick(T[] arr,int low,int high){
int part=partition(arr,low,high);
if(low+1<part){
quick(arr,low,part-1);
}
if(part+1<high){
quick(arr,part+1,high);
}
}
public static<T extends Comparable<T>>void quickSort(T[] arr){
quick(arr,0,arr.length-1);
}
public static void main(String[] args){
Integer[] arr = new Integer[]{2,4,6,1,3,8,5,9};
quickSort(arr);
System.out.println(Arrays.toString(arr));
}
1.4快速排序算法分析
(1)时间复杂度分析
最优时间复杂度:O(nlog2n) , 平均数间复杂度:O(nlog2n), 最坏时间复杂度:O(nlog2n)。
(2)空间复杂度分析
O(1)
(3)稳定性分析:不稳定
1.5选择基准的方式
每次划分时,算法若是能分成两个等长的子序列时,那么分治算法效率会达到最大。选择基准的方式决定了分割后两个子序列的长度,进而对整个算法的效率产生影响。
最理想的方式是把待排序列分成两个等长的子序列。
1.5.1.固定位置
思想:取序列的第一个或最后一个元素作为基准。
基本的快速排序:
public static<T>T selectPivot(T arr[],int low,int high){
return arr[low];//选择序列的第一个元素作为基准
}
如果输入序列是随机的,处理时间是可以接受的。如果数组已经有序,此时的分割就是不好的分割,每次划分只能使待排序序列减1,此时为最坏情况,快速排序沦为冒泡排序,时间复杂度为O(n^2)。因此把序列的第一个元素作为基准是非常糟糕的。
1.5.2随机选取基准
随机选择枢轴的位置,区间在low和high之间,把枢轴位置的元素和low互换,此时可以和普通的快排一样调用划分函数。
这种策略相对安全,但是当整个数组数字全相等时,任然是最坏情况,时间复杂度为O(n^2)。随机化快速排序理论的到的最坏情况是1/(2^n)。所以随机化快速排序可以对于绝大多数输入数据达到O(nlogn)的期望复杂度。
1.5.3三数取中(优化有序的数据)
要缓解随机选取基准出现不好分割情况,时间复杂度为O(n^2)的情况。选取三数取中选取枢轴。
使用左端、右端、中心位置的三个元素的中值作为枢纽元,消除了预排序输入的不好情况,并且减少快排大约14%的比较次数。
在选取中值时,可以从左中右三个中选取扩大到五个元素或者更多元素。一般会有 (2t+1)个平均分取法。
对待排序序列中的low、mid、high三个位置上数据进行排序,取他们中间的那个数据作为枢轴,并用0下标存储枢轴。
private static<T>void swap(T[] arr,int index1,int index2){
T temp = arr[index1];
arr[index1]=arr[index2];
arr[index2]=temp;
}
public static<T extends Comparable<T>> T selectPivotMedianOfThree(T[] arr,int low,int high){
int mid=low+((high-low)>>1);
if(arr[mid].compareTo(arr[high])>0){
swap(arr,mid,high);
}
if(arr[low].compareTo(arr[high])>0){
swap(arr,low,high);
}
if(arr[low].compareTo(arr[mid])<0){
swap(arr,low,mid);
}
//此时,arr[mid]<=arr[low]<=arr[high]
return arr[low];//low的位置保存这三个位置中间的值
//分割时,可以直接使用low位置的元素作为枢轴,而不用改变分割函数了
}
1.5.4优化分析
选择三数取中选择枢轴优势明显,但是处理不了重复数组。
优化1:当代排序序列分割到一定大小后,使用插入排序。
原因:对于很小和部分有序的数组,快排不如插排好。当待排序序列的长度分割到一定大小后,继续分割的效率比插入排序要差,此时可以使用插排而不是快排。
截止范围:待排序序列长度N=10,虽然在5-20之间任意截止范围都有可能产生类似的结果,这种做法避免了一些有害的退化情形。
if((high-low+1)<10){
insertSort(arr,low,high){
}else{
//正常执行快排
}
三数取中+插排优势明显