重拾经典排序算法
排序算法分为简单排序(冒泡、选择、插入)、高级排序(希尔、归并、快排)
一、简单排序
1、冒泡排序:
-
比较相邻的元素。如果前一个元素比后一个元素大,就交换这两个元素的位置。
-
对每一对相邻元素做同样的工作,从开始第一对元素到结尾的最后一对元素。最终最后位置的元素就是最大值
Java实现:
//冒泡排序实现1:把大值往后沉
public static int[] sort2(int[] a) {
int len = a.length; //求数组长度
for(int i = len-1; i > 0; i--) { //下沉位置
for(int j = 0; j < i; j++) { //逐个比较,前者大于后者则交换
if(a[j] > a[j+1]) {
int temp = a[j];
a[j] = a[j+1];
a[j+1] = temp;
}
}
}
return a;
}
//冒泡排序实现2:把小值往前冒
public static int[] sort3(int[] a) {
int len = a.length;
for(int i = 0; i < len; i++) { //上浮位置
for(int j = len-1; j > i; j--) { //逐个比较,后者小于前者则交换
if(a[j] < a[j-1]) {
int temp = a[j];
a[j] = a[j-1];
a[j-1] = temp;
}
}
}
return a;
}
冒泡排序时间复杂度分析:
冒泡排序使用了双层for循环,其中内层循环的循环体是真正完成排序的代码,所以,我们分析冒泡排序的时间复杂度,主要分析一下内层循环体的执行次数即可。
在最坏情况下,也就是假如要排序的元素为{6,5,4,3,2,1}逆序,那么:
元素比较的次数为:
(N-1)+(N-2)+(N-3)+…+2+1 构成一个等差序列,值求和即可
n
(
n
−
1
)
2
\frac{n(n-1)}{2}
2n(n−1)
元素交换的次数为:
(N-1)+(N-2)+(N-3)+…+2+1 =
n
(
n
−
1
)
2
\frac{n(n-1)}{2}
2n(n−1)
总执行次数为:N^2-N
按照大O推导法则,保留函数中的最高阶项那么最终冒泡排序的时间复杂度为O(N^2).
2、选择排序:
- 每一次遍历的过程中,都假定第一个索引处的元素是最小值,和其他索引处的值依次进行比较,如果当前索引处
的值大于其他某个索引处的值,则假定其他某个索引出的值为最小值,最后可以找到最小值所在的索引 - 交换第一个索引处和最小值所在的索引处的值
Java实现:
//选择排序实现
public static int[] sort(int[] a) {
int len = a.length; //求数组长度
for(int i = 0; i < len-1; i++) {
int minIndex = i; //记录最小值小标
for(int j = i+1; j < len; j++) { //找到最小值,并记录下标
if(a[minIndex] > a[j]) {
minIndex = j;
}
}
if(minIndex != i) { //若最小值下标不等于当前下标位置,交换最值与当前值
int t = a[minIndex];
a[minIndex] = a[i];
a[i] = t;
}
}
return a;
}
选择排序的时间复杂度分析:
选择排序使用了双层for循环,其中外层循环完成了数据交换,内层循环完成了数据比较,所以我们分别统计数据
元素比较次数:
(N-1)+(N-2)+(N-3)+…+2+1
n
(
n
−
1
)
2
\frac{n(n-1)}{2}
2n(n−1)
数据交换次数:
N-1
根据大O推导法则,保留最高阶项,去除常数因子,时间复杂度为O(N^2);
3、插入排序
-
把所有的元素分为两组,已经排序的和未排序的;
-
找到未排序的组中的第一个元素,向已经排序的组中进行插入;
-
倒叙遍历已经排序的元素,依次和待插入的元素进行比较,直到找到一个元素小于等于待插入元素,那么就把待
插入元素放到这个位置,其他的元素向后移动一位;
Java实现:
//插入排序实现
public static int[] sort(int[] a) {
int len = a.length; //求数组长度
for(int i = 1; i < len; i++) { //当前要插入的元素
for(int j = i; j > 0; j--) { //当前元素小于前者,则交换
if(a[j] < a[j-1]) {
int temp = a[j];
a[j] = a[j-1];
a[j-1] = temp;
} else {
break;
}
}
}
return a;
}
插入排序的时间复杂度分析:
插入排序使用了双层for循环,其中内层循环的循环体是真正完成排序的代码,所以,我们分析插入排序的时间复
杂度,主要分析一下内层循环体的执行次数即可。
最坏情况,也就是待排序的数组元素为{12,10,6,5,4,3,2,1},那么:
比较的次数为:
(N-1)+(N-2)+(N-3)+…+2+1
交换的次数为:
(N-1)+(N-2)+(N-3)+…+2+1
总执行次数为:N^2-N;
按照大O推导法则,保留函数中的最高阶项那么最终插入排序的时间复杂度为O(N^2).
二、高级排序
1、希尔排序
希尔排序是插入排序的一种,又称“缩小增量排序”,是插入排序算法的一种更高效的改进版本。
排序原理:
【1】选定一个增长量h,按照增长量h作为数据分组的依据,对数据进行分组;
【2】对分好组的每一组数据完成插入排序;
【3】减小增长量,最小减为1,重复第二步操作。
增长量 h的确定:增长量h的值每一固定的规则,我们这里采用以下规则:
//循环结束后我们就可以确定h的最大值;
int h=1
while(h<5){
h=2h+1;
}
//h的减小规则为:
h=h/2
Java 实现:
//希尔排序实现
public static int[] sort(int[] a) {
int len = a.length; //求数组长度
int h = 1;
while(h < len/2) { //根据数组长度确定最初的增长量
h = h*2 + 1;
}
while(h >= 1) {
for(int i = h; i < len; i++) { //待插入的元素,a[i]就是待插入的元素
//把a[i]插入到a[i-h],a[i-2h],a[i-3h]...序列中
for(int j = i; j >= h; j -= h) {
//a[j]就是待插入元素,依次和a[j-h],a[j-2h],a[j-3h]进行比较,
//如果a[j]小,那么交换位置,如果不小于,a[j]大,则插入完成。
if(a[j] < a[j-h]) {
int temp = a[j];
a[j] = a[j-h];
a[j-h] = temp;
} else {
break;
}
}
}
h /= 2; //减小增长量
}
return a;
}
希尔排序的时间复杂度分析:
- 希尔排序的时间复杂度为O(n^1.3) ~O(n^2),因此中等大小规模表现良好
2、归并排序
归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个非常典型的应用。将已有序的子
序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序
表,称为二路归并。
排序原理:
【1】尽可能的一组数据拆分成两个子组,并对每一个子组继续拆分,直到拆分后的每个子组的元素个数是1为止。
【2】将相邻的两个子组进行合并成一个有序的大组;
【3】不断的重复步骤2,直到最终只有一个组为止。
package com.xiaojie.sort;
import java.util.Arrays;
/**
* @author Mrli
* @date 2020/9/9 20:44
*/
public class MergeSort {
//合并
public static void merge(int[] a, int low, int mid, int high) {
int[] temp = new int[high - low + 1]; //中间数组
int i = low;// 左指针
int j = mid + 1;// 右指针
int k = 0;
// 把较小的数先移到新数组中
while (i <= mid && j <= high) {
if (a[i] < a[j]) {
temp[k++] = a[i++];
} else {
temp[k++] = a[j++];
}
}
// 把左边剩余的数移入数组
while (i <= mid) {
temp[k++] = a[i++];
}
// 把右边边剩余的数移入数组
while (j <= high) {
temp[k++] = a[j++];
}
// 把新数组中的数覆盖nums数组
for (int k2 = 0; k2 < temp.length; k2++) {
a[k2 + low] = temp[k2];
}
}
//拆分
public static void mergeSort(int[] a, int low, int high) {
int mid = (low + high) / 2;
if (low < high) {
// 左边
mergeSort(a, low, mid);
// 右边
mergeSort(a, mid + 1, high);
// 左右归并
merge(a, low, mid, high);
}
}
public static void main(String[] args) {
int a[] = {8,4,5,7,1,3,6,2};
mergeSort(a, 0, a.length - 1);
System.out.println("排序结果:" + Arrays.toString(a));
}
}
归并排序时间复杂度分析:
归并排序是分治思想的最典型的例子,上面的算法中,对a[lo…hi]进行排序,先将它分为a[lo…mid]和a[mid+1…hi]两部分,分别通过递归调用将他们单独排序,最后将有序的子数组归并为最终的排序结果。该递归的出口在于如果一个数组不能再被分为两个子数组,那么就会执行merge进行归并,在归并的时候判断元素的大小进行排序。
如果一个数组有8个元素,那么它将每次除以2找最小的子数组,共拆log8次,值为3,所以树共有3层,那么自顶向下第k层有2k个子数组,每个数组的长度为2(3-k),归并最多需要2^(3-k)次比较。因此每层的比较次数为 2^k * 2(3-k)=23,那么3层总共为 3*2^3。
假设元素的个数为n,那么使用归并排序拆分的次数为log2(n),所以共log2(n)层,那么使用log2(n)替换上面32^3中的3这个层数,最终得出的归并排序的时间复杂度为:log2(n) 2^(log2(n))=log2(n)*n,根据大O推导法则,忽略底数,最终归并排序的时间复杂度为O(nlogn);
归并排序的缺点:
需要申请额外的数组空间,导致空间复杂度提升,是典型的以空间换时间的操作。
3、快速排序
快速排序是对冒泡排序的一种改进。它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
排序原理:
【1】首先设定一个分界值,通过该分界值将数组分成左右两部分;
【2】将大于或等于分界值的数据放到到数组右边,小于分界值的数据放到数组的左边。此时左边部分中各元素都小于
或等于分界值,而右边部分中各元素都大于或等于分界值;
【3】然后,左边和右边的数据可以独立排序。对于左侧的数组数据,又可以取一个分界值,将该部分数据分成左右两
部分,同样在左边放置较小值,右边放置较大值。右侧的数组数据也可以做类似处理。
【4】重复上述过程,可以看出,这是一个递归定义。通过递归将左侧部分排好序后,再递归排好右侧部分的顺序。当
左侧和右侧两个部分的数据排完序后,整个数组的排序也就完成了。
Java实现:
package com.xiaojie.sort;
import java.util.Arrays;
/**
* @author Mrli
* @date 2020/9/9 20:53
*/
public class QuickSort {
/**
* 快排实现
* @param arr
* @param low
* @param high
*/
public static void quickSort(int[] arr,int low,int high) {
if(low >= high) {
return;
}
//p就是基准数,这里就是每个数组的第一个
int p = arr[low];
int i = low, j = high;
while(i < j) {
//右边当发现小于p的值时停止循环
while(arr[j] >= p && i < j) {
j--;
}
//左边当发现大于p的值时停止循环
while(arr[i] <= p && i < j) {
i++;
}
if(i != j) {
int temp = arr[j];
arr[j] = arr[i];
arr[i] = temp;
}
}
//交换最后i索引处和基准值所在的索引处的值
arr[low] = arr[i];
arr[i] = p;
quickSort(arr,low,j-1); //对左边快排
quickSort(arr,j+1,high); //对右边快排
}
public static void main(String[] args) {
int[] arr = new int[] {9,4,6,8,3,10,4,6};
quickSort(arr,0,arr.length - 1);
System.out.println(Arrays.toString(arr));
}
}
快速排序时间复杂度分析:
如果我们把数组的切分看做是一个树,那么上图就是它的最优情况的图示,共切分了 logn次,所以,最优情况下快速排序的时间复杂度为O(nlogn);
最坏情况:每一次切分选择的基准数字是当前序列中最大数或者最小数,这使得每次切分都会有一个子组,那么总共就得切分n次,所以,最坏情况下,快速排序的时间复杂度为O(n^2);
平均情况:每一次切分选择的基准数字不是最大值和最小值,也不是中值,这种情况我们也可以用数学归纳法证明,快速排序的时间复杂度为O(nlogn)
三、排序的稳定性
稳定性的定义:
数组arr中有若干元素,其中A元素和B元素相等,并且A元素在B元素前面,如果使用某种排序算法排序后,能够保
证A元素依然在B元素的前面,可以说这个该算法是稳定的。
稳定性排序: 冒泡、插入、归并
冒泡排序:
只有当arr[i]>arr[i+1]的时候,才会交换元素的位置,而相等的时候并不交换位置,所以冒泡排序是一种稳定排序算法。
插入排序:
比较是从有序序列的末尾开始,也就是想要插入的元素和已经有序的最大者开始比起,如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的,那么把要插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的
归并排序:
归并排序在归并的过程中,只有arr[i]<arr[i+1]的时候才会交换位置,如果两个元素相等则不会交换位置,所以它
并不会破坏稳定性,归并排序是稳定的。
不稳定的排序: 选择、希尔、快排
选择排序:
选择排序是给每个位置选择当前元素最小的,例如有数据{5(1),8 ,5(2), 2, 9 },第一遍选择到的最小元素为2,所以5(1)会和2进行交换位置,此时5(1)到了5(2)后面,破坏了稳定性,所以选择排序是一种不稳定的排序算法。
希尔排序:
希尔排序是按照不同步长对元素进行插入排序 ,虽然一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以希尔排序是不稳定的。
快速排序:
快速排序需要一个基准值,在基准值的右侧找一个比基准值小的元素,在基准值的左侧找一个比基准值大的元素,然后交换这两个元素,此时会破坏稳定性,所以快速排序是一种不稳定的算法。