冒泡排序:
将当前数与它后一个数进行比较,如果当前数大于后一个数,则它们交换位置。当前数索引加1,循环判断。直到当前数为倒数第二个数时,结束本轮比较。选出了最大数并放于最后。继续从头循环比较,直到当前数为倒数第三个数时,结束本轮比较,选出了次大数到倒数第二个位置。就想冒泡一样,一轮比较选出一个最大数到最后。
代码:
@Test
public void reOrder(){
int[] source = {1, 5, 3, 4, 2};
for (int i = 0; i < source.length-1; i++) {
for (int j = 0; j < source.length - 1 - i; j++) {
if (source[j] > source[j + 1]) {
int x = source[j];
source[j] = source[j + 1];
source[j+1] = x;
}
}
}
System.out.println(Arrays.toString(source));
}
-
优化点1:每经过一轮冒泡,内层循环就可以减少一次
-
优化点2:如果某一轮冒泡没有发生交换,则表示所有数据有序,可以结束外层循环
-
优化点3:每轮冒泡时,最后一次交换索引可以作为下一轮冒泡的比较次数,如果这个值为零,表示整个数组有序,直接退出外层循环即可
@Test
public void bubble_v2() {
int[] ar = {1, 5, 2, 4, 3};
int n = ar.length - 1;
while (true) {
int last = 0; // 表示最后一次交换索引位置
for (int i = 0; i < n; i++) {
System.out.println("比较次数" + i);
if (ar[i] > ar[i + 1]) {
swap(ar, i, i + 1);
last = i;
}
}
n = last;
System.out.println("第轮冒泡"
+ Arrays.toString(ar));
if (n == 0) {
break;
}
}
}
public void swap(int[] a, int l, int h) {
int x = a[l];
a[l] = a[h];
a[h] = x;
}
选择排序:
每轮比较,选择一个最小的到前面。即假定当前遍历数位最小数,依次和它后面的数进行比较,如有比她小的则和它进行交互。每轮比较得到一个最小数。
@Test
public void reOrderBySelect(){
int[] ar = {1, 7, 3, 5, 2, 4};
for (int i = 0; i < ar.length-1; i++) {
for (int j = i+1; j < ar.length; j++) {
if (ar[i] > ar[j]) {
int x = ar[i];
ar[i] = ar[j];
ar[j] = x;
}
}
}
System.out.println(Arrays.toString(ar));
}
与冒泡排序比较
-
二者平均时间复杂度都是 $O(n^2)$
-
选择排序一般要快于冒泡,因为其交换次数少
-
但如果集合有序度高,冒泡优于选择
-
冒泡属于稳定排序算法,而选择属于不稳定排序
-
稳定排序指,按对象中不同字段进行多次排序,不会打乱同值元素的顺序
-
不稳定排序则反之
-
插入排序
从无序的数中选择一个数到有序的数中,从有序数中从大到小比较,大于该数的数都向后移动一个位置,直到不大于这个数停止,当前位置则是该数的位置。
@Test
public void reOrderByInsert(){
int[] ar = {12, 45, 24, 21, 26, 13};
for (int i = 1; i < ar.length; i++) {
//i为无序的数索引
//j为有序数组末尾
int j = i - 1;
int temp = ar[i];
while (j > 0) {
if (temp < ar[j]) {
//有序数向后移动,为新来的数腾位置
ar[j + 1] = ar[j];
} else {
break;
}
//新来的数应该待的位置
ar[j] = temp;
j--;
}
}
System.out.println(Arrays.toString(ar));
}
与选择排序比较
-
二者平均时间复杂度都是 $O(n^2)$
-
大部分情况下,插入都略优于选择
-
有序集合插入的时间复杂度为 $O(n)$
-
插入属于稳定排序算法,而选择属于不稳定排序
注意:小数据量排序,都会优先选择插入排序
希尔排序:
-
首先选取一个间隙序列,如 (n/2,n/4 … 1),n 为数组长度
-
每一轮将间隙相等的元素视为一组,对组内元素进行插入排序,目的有二
① 少量元素插入排序速度很快
② 让组内值较大的元素更快地移动到后方
-
当间隙逐渐减少,直至为 1 时,即可完成排序
-
@Test public void shell() { int[] ar = {12, 45, 24, 21, 26, 13}; int n = ar.length; for (int gap = n / 2; gap > 0; gap /= 2) { // i 代表待插入元素的索引 for (int i = gap; i < n; i++) { int t = ar[i]; // 代表待插入的元素值 int j = i; while (j >= gap) { // 每次与上一个间隙为 gap 的元素进行插入排序 if (t < ar[j - gap]) { // j-gap 是上一个元素索引,如果 > t,后移 ar[j] = ar[j - gap]; j -= gap; } else { // 如果 j-1 已经 <= t, 则 j 就是插入位置 break; } } ar[j] = t; } } System.out.println(Arrays.toString(ar)); }
快速排序:
-
每一轮排序选择一个基准点(pivot)进行分区
-
让小于基准点的元素的进入一个分区,大于基准点的元素的进入另一个分区
-
当分区完成时,基准点元素的位置就是其最终位置
-
-
在子分区内重复以上过程,直至子分区元素个数少于等于 1,这体现的是分而治之的思想 (divide-and-conquer)
-
从以上描述可以看出,一个关键在于分区算法,常见的有洛穆托分区方案、双边循环分区方案、霍尔分区方案
单边循环快排(lomuto 洛穆托分区方案)
-
选择最右元素作为基准点元素
-
j 指针负责找到比基准点小的元素,一旦找到则与 i 进行交换
-
i 指针维护小于基准点元素的边界,也是每次交换的目标索引
-
最后基准点与 i 交换,i 即为分区位置
@Test
public void testQuick(){
int[] ar = {1, 5, 3, 2, 4};
quick(ar,0,ar.length-1);
System.out.println(Arrays.toString(ar));
}
public void quick(int[] a, int l, int h) {
if (l >= h) {
return;
}
int p = partition(a, l, h); // p 索引值
quick(a, l, p - 1); // 左边分区的范围确定
quick(a, p + 1, h); // 左边分区的范围确定
}
public int partition(int[] a, int l, int h) {
int pv = a[h]; // 基准点元素
int i = l;
for (int j = l; j < h; j++) {
if (a[j] < pv) {
if (i != j) {
swap(a, i, j);
}
i++;
}
}
if (i != h) {
swap(a, h, i);
}
System.out.println(Arrays.toString(a) + " i=" + i);
// 返回值代表了基准点元素所在的正确索引,用它确定下一轮分区的边界
return i;
}
public void swap(int[] a, int l, int h) {
int x = a[l];
a[l] = a[h];
a[h] = x;
}
双边循环快排(不完全等价于 hoare 霍尔分区方案)
-
选择最左元素作为基准点元素
-
j 指针负责从右向左找比基准点小的元素,i 指针负责从左向右找比基准点大的元素,一旦找到二者交换,直至 i,j 相交
-
最后基准点与 i(此时 i 与 j 相等)交换,i 即为分区位置
要点
-
基准点在左边,并且要先 j 后 i
-
while( i < j && a[j] > pv ) j--
-
while ( i < j && a[i] <= pv ) i++
@Test
public void testQuick(){
int[] ar = {1, 5, 3, 2, 4};
quick(ar,0,ar.length-1);
System.out.println(Arrays.toString(ar));
}
public void quick(int[] a, int l, int h) {
if (l >= h) {
return;
}
int p = partition(a, l, h);
quick(a, l, p - 1);
quick(a, p + 1, h);
}
public int partition(int[] a, int l, int h) {
int pv = a[l];
int i = l;
int j = h;
while (i < j) {
// j 从右找小的
while (i < j && a[j] > pv) {
j--;
}
// i 从左找大的
while (i < j && a[i] <= pv) {
i++;
}
swap(a, i, j);
}
swap(a, l, j);
System.out.println(Arrays.toString(a) + " j=" + j);
return j;
}
public void swap(int[] a, int l, int h) {
int x = a[l];
a[l] = a[h];
a[h] = x;
}
快排特点
-
平均时间复杂度是 $O(nlog_2n )$,最坏时间复杂度 $O(n^2)$
-
数据量较大时,优势非常明显
-
属于不稳定排序
洛穆托分区方案 vs 霍尔分区方案