常见的排序算法
一、基于比较的排序
对于排序的定义就是使一串记录,按照其中的某个或某些关键字的大小,递增或者递减的排列起来的操作。常见的排序算法有希尔排序、快速排序、堆排序等。对于排序算法来讲比较重要的特性就是其稳定性,稳定性的定义:在排序的过程中,两个相同的数据,经过排序后,如果能保证其相对位置不发生变化,则称该算法具备稳定性。一个稳定的排序,可以实现为不稳定的排序,但是本身就不稳定的排序,是不可能变成稳定的排序的。其实判断排序是否具有稳定性,可以通过判断其在比较的过程中,是否发生了跳跃式交换,如果发生了跳跃式交换,就是不稳定的排序。
1 插入排序
插入排序包含两个排序算法,直接插入排序和希尔排序。
1.1 直接插入排序
直接插入排序算法是将待排序的数组分为两个区间,有序区间和无序区间,每次选择无序区间的第一个元素,在有序区间内选择合适的位置插入。
直接插入排序的时间复杂度(最坏的情况下)为:O(n^2),空间复杂度:O(1),稳定性:稳定的排序。插入排序,初始数据越接近有序,时间效率越高。
public static void insertSort(int[] array) {
for (int i = 1; i < array.length ; i++) {
//有序区间:[0,i)
//无序区间:[i,array.length)
int tmp = array[i];//无序区间的第一个数(待排的数)
int j = i - 1;
for (; j >= 0; j--) {
if(array[j] > tmp) {
array[j+1] = array[j];
}else {
break;
}
}
array[j+1] = tmp;
}
}
直接插入排序优化:由于前半部分区间是有序的,因此在寻找插入位置的时候可以采用折半查找的思想。
1.2 希尔排序
希尔排序法又称缩小增量法,它的思想是,将待排序的文件或者数组分成gap个组,所有距离为gap的记录分在同一组。对每一个组里的数据进行排序,使得每一组内数据有序。并减少gap进行重新分组排序循环上述操作,直到最后gap=1,整个数组进行排序即可。对于希尔排序的gap的选择是一个数学难题,需要注意的是,增量中的值没有除1之外的公因子,并且最后一个增量必须是1。
希尔排序是对直接插入排序的优化,在数组相对有序的情况下,时间复杂度会比较低。时间复杂度:O(n1.3~n1.5),空间复杂度O(1),稳定性:不稳定的排序。
public static void shell(int[] array,int gap) {
for (int i = gap; i < array.length ; i++) {
int tmp = array[i];
int j = i - gap;
for (; j >= 0 ; j -= gap) {
if(array[j] > tmp) {
array[j+gap] = array[j];
}else {
break;
}
}
array[j+gap] = tmp;
}
}
public static void shellSort(int[] array) {
int gap = array.length;
while(gap > 1) {
shell(array,gap);
gap /= 2;
}
shell(array,1);//保证最后 gap=1
}
2 选择排序
2.1直接选择排序
直接选择排序的思想是:每次从无序区间选出最大(或最小)的一个元素,存放在无序区间的最后(或者最前),直到全部待排数据元素排完。
public static void swap(int[] array,int i,int j) {
int tmp = array[i];
array[i] = array[j];
array[j] = tmp;
}
public static void selectSort(int[] array) {
for (int i = 0; i < array.length ; i++) {
int j = i + 1;
int minFlg = 0;//标志位记录一次比较最小的数的下标
for (; j < array.length ; j++) {
if(array[j] < array[minFlg])
minFlg = j;
}
swap(array,i,minFlg);
}
}
时间复杂度为:O(n2),空间复杂度:O(1),稳定性:是不稳定的排序。
3 堆排序
堆排序的基本原理也是选择排序,只是不在使用遍历的方式查找无序空间的最大的数,而是通过建立大根堆(小根堆)查找区间的最大值(最小值)。思想:(1)将大根堆的根节点和最后一个结点交换,最后一个元素就是最大的元素;
(2)交换后的堆重新调整成大根堆,使得根节点元素是最大的元素。
(3)将根节点与倒数第二个数交换,再下调,重复此操作直到根节点,就得到一个从小到大的堆。
时间复杂度:O(n*log n),空间复杂度:O(1),稳定性:不稳定的排序。
public static void heapSort(int[] array) {
//建堆 O(n)
createHeap(array);
int end = array.length - 1;
//交换并调整 O(n*log n)
while(end > 0) {
swap(array,0,end);
shiftDown(array,0,end);
end--;
}
}
//创建大根堆
public static void createHeap(int[] array) {
for(int parent = (array.length-1-1)/2;parent >= 0;parent--) {
shiftDown(array,parent,array.length);
}
}
//向下调整
public static void shiftDown(int[] array,int parent,int len) {
int child = 2*parent+1;//左孩子下标
while(child < len) {
if(child+1 < len && array[child] < array[child+1]) {
child++;//child下标记录最大的孩子结点
}
if(array[child] > array[parent]) {
swap(array,child,parent);
parent = child;
child = 2*parent + 1;
}else {
break;
}
}
}
4 冒泡排序
冒泡排序应该是大家接触最早,思想相对简单的排序思想,即将无序区间,相邻数比较,将最大的数冒泡到无序区间的最后,持续这个过程,直到整个数组整体有序。
public void bubbleSort(int[] array) {
for (int i = 0; i < array.length-1 ; i++) {
boolean flg = false;
for (int j = 0; j < array.length-1-i ; j++) {
if(array[j] > array[j+1]) {
swap(array,j,j+1);
flg = true;
}
}
if(flg == false) {
break;
}
}
}
时间复杂度:O(n2),空间复杂度O(1),稳定性:是稳定的排序。
5 快速排序
快速排序的思想是在待排序的区间选取一个数作为基准(pivot),遍历整个待排序区间,比基准值小的放在基准值的左边,将比基准值大的放在基准值的右边,对两边的小区间采用同样的方式,直到区间的长度等于1,代表已经有序。
基准值(pivot)的选取对整个排序复杂度有很大的影响,其位置的获取也是快速排序的重点,常用的方式是:
(1)将数组的第一个元素(start)给tmp,从数组的最后一个元素(end)开始,如果end对应的值大于tmp的值,end–,如果小于tmp,就将该值与start位置。
(2)从start位置开始向后比较如果小于tmp的值,start++,如果大于就将该值与end下标交换,直到end=start。
此种方式,是将start对应的值寻找它的位置,就可以得到下一次递归的区间,还可以取中间值作为基准值。取array[left],array[mid],array[right]大小的中间值作为基准,与start对应的值相交换,可以提高效率。
public static void quickSort(int[] array,int left,int right) {
if(left >= right) {
return;
}
//如果排序的数组的不大,并且相对有序,那可以直接采用插入排序
if(right-left-1 <= 40) {
insertSort2(array,left,right);
return;
}
//在找基准之前,找到中间大小的值
int midValIndex = findMidValIndex(array,left,right) ;
//将中间值与最左边的进行交换
swap(array,midValIndex,left);
int pivot = partition(array,left,right);//基准
quick(array,left,pivot-1);
quick(array,pivot+1,right);
}
//寻找中间值大小
public static int findMidValIndex(int[] array,int start,int end) {
int mid = start + ((end-start) >>> 1);
if(array[start] < array[end]) {
if(array[mid] < array[start]) {
return start;
}else if(array[mid] > array[end]) {
return end;
}else {
return mid;
}
}else {
if(array[mid] > array[start]) {
return start;
}else if(array[mid] < array[end]) {
return end;
}else {
return mid;
}
}
}
//寻找基准的函数
public static int partition(int[] array,int start,int end) {
int tmp = array[start];
while(end > start) {
while(array[end] >= tmp && end > start) {
end--;//不写等号可能会陷入死循环
}
array[start] = array[end];
while(start < end && array[start] <= tmp) {
start++;
}
array[end] = array[start];
}
array[start] = tmp;
return start;
}
在快速排序的过程中还有优化的点就是,在待排序的区间小到一定程度时,可以采用直接插入排序,降低复杂度。
//优化:在排序的过程中,小于某个范围了,可以使用直接插入排序
public static void insertSort2(int[] array,int start,int end) {
for (int i = 1; i <= end ; i++) {
int tmp = array[i];
int j = i - 1;
for (; j >= start ; j--) {
if(array[j] > tmp) {
array[j+1] = array[j];
}else {
break;
}
}
array[j+1] = tmp;
}
}
上述是快速排序的递归实现,快速排序的非递归实现:
public static void quickSort2(int[] array) {
Stack<Integer> stack = new Stack<>();//栈用来记录每次找基准的边界
int left = 0;
int right = array.length - 1;
int pivot = partition(array,left,right);//找基准的过程就会排大小。
if(pivot > left+1) {
//左边有2个元素
stack.push(left);
stack.push(pivot-1);
}
if(pivot < right-1) {
//右边有2个元素
stack.push(pivot+1);
stack.push(right);
}
while(!stack.isEmpty()) {
right = stack.pop();
left = stack.pop();
pivot = partition(array,left,right);
if(pivot > left+1) {
stack.push(left);
stack.push(pivot-1);
}
if(pivot < right-1) {
stack.push(pivot+1);
stack.push(right);
}
}
}
6 归并排序
归并排序是先使每个子序列有序,再使子序列短剑有序,主要是利用将两个有序数组合并成一个有序数组的思想。
归并排序的递归实现:
public static void mergeSort1(int[] array) {
mergeSortInternal(array,0,array.length-1);
}
private static void mergeSortInternal(int[] array,int low,int high) {
if(low >= high) {
return;
}
int mid = low + ((high-low)>>>1);
//左边
mergeSortInternal(array,low,mid);
//右边
mergeSortInternal(array,mid+1,high);
//合并左右两边数组
merge(array,low,mid,high);
}
private static void merge(int[] array,int low,int mid,int high) {
int[] tmp = new int[high-low+1];
int k = 0;
int s1 = low;
int e1 = mid;
int s2 = mid+1;
int e2 = high;
while(s1 <= e1 && s2 <= e2) {
if(array[s1] <= array[s2]) {
tmp[k++] = array[s1++];
}else {
tmp[k++] = array[s2++];
}
}
while(s1 <= e1) {
tmp[k++] = array[s1++];
}
while (s2 <= e2) {
tmp[k++] = array[s2++];
}
//拷贝tmp数组到原来数组当中
for (int i = 0; i < tmp.length ; i++) {
array[low+i] = tmp[i];
}
}
归并排序的非递归实现
public static void mergeSort(int[] array) {
//nums每组的数据个数,开始时每次一个元素,再逐个增加
int nums = 1;
while(nums < array.length) {
//确定每次遍历的数组下标,left,mid,right,每一趟不同组里的下标不同。
for (int i = 0; i < array.length; i+= nums*2) {
int left = i;
int mid = left+nums-1;
//要判断mid和right的值是否越界
if(mid >=array.length) {
mid = array.length - 1;
}
int right = mid + nums;
if(right >= array.length) {
right = array.length - 1;
}
//下标确定之后,进行合并
merge(array,left,mid,right);
}
nums *= 2;
}
}
归并排序的时间复杂度:O(n*logn),空间复杂度:O(n),稳定性:是稳定的排序。
二、基于非比较的排序
基于非比较的排序有计数排序和基数排序等。
(1)基数排序:先建立以0到9为下标的十个队列,再按照需要排序的数的个位数字将这些数,入队到相应的队列中,再按照0~9的顺序将这些数出队,那么这些数的个位就有序了,再以十位入队、出队那么十位就有序了,依次类推直到数组最大数的最高位入队出队结束,整个数组就是有序的了。
(2)计数排序:是对有n个数,并且这些数的范围在0~n的数组进行计数再输出即可,时间复杂度O(n),空间复杂度O(m),m代表当前数据的范围,稳定性:本质是稳定的。
public static void countingSort(int[] array) {
int minVal = array[0];
int maxVal = array[0];
for (int i = 1; i < array.length; i++) {
if(array[i] < minVal) {
minVal = array[i];
}
if(array[i] >maxVal) {
maxVal = array[i];
}
}
int[] count = new int[maxVal-maxVal+1];
//计数数组中,已经把array数组当中,每个数据出现的次数已经统计好了
for (int i = 0; i < array.length; i++) {
int index = array[i];
count[index-minVal]++;//防止出现前面空很多,浪费空间复杂度
}
//将计数数组写回原来数组
int indexArray = 0;
for (int i = 0; i < count.length; i++) {
while(count[i] > 0) {
array[indexArray] =i + minVal;
count[i]--;//拷贝一次,次数--
indexArray++;//原来数组的下标++
}
}
}
以上为排序的所有内容,欢迎批评指正!