排序算法

     排序是程序开发中一种非常常见的操作,对一组任意的数据元素(或记录)经过排序操作后,就可以把他们变成一组按关键字排序的有序队列。

对一个排序算法来说,一般从下面3个方面来衡量算法的优劣:

  1. 时间复杂度:它主要是分析关键字的比较次数和记录的移动次数。
  2. 空间复杂度:分析排序算法中需要多少辅助内存。
  3. 稳定性:若两个记录A和B的关键字值相等,但是排序后A,B的先后次序保持不变,则称这种排序算法是稳定的;反之,就是不稳定的。

就现有的排序算法来看,排序大致可分为内部排序和外部排序。如果整个排序过程不需要借助外部存储器(如磁盘等),所有排序操作都是在内存中完成,这种排序就被称为内部排序。

       如果参与排序的数据元素非常多,数据量非常大,计算无法把整个排序过程放在内存中完成,必须借助于外部存储器(如磁盘),这种排序就被称为外部排序。

      外部排序最常用算噶是多路归并排序,即将原文件分解称多个能够一次性装入内存的部分,分别把每一部分调入内存完成排序,接下来再对多个有序的子文件进行归并排序。

     就常用的内部排序算法来说,可以分为以下几类:

  • 选择排序(直接选择排序,堆排序)
  • 交换排序(冒泡排序,快速排序)
  • 插入排序(直接插入排序,折半插入排序,Shell排序)
  • 归并排序
  • 桶式排序
  • 基数排序


Java排序算法(二):直接选择排序

直接选择排序的基本操作就是每一趟从待排序的数据元素中选出最小(或最大)的一个元素,顺序放在已排好序的数列的最后,直到全部待排序的数据元素排完,它需要经过n-1趟比较。算法不稳定,O(1)的额外的空间,比较的时间复杂度为O(n^2),交换的时间复杂度为O(n),并不是自适应的。在大多数情况下都不推荐使用。只有在希望减少交换次数的情况下可以用。

基本思想

n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果:

①初始状态:无序区为R[1..n],有序区为空。

②第1趟排序

在无序区R[1..n]中选出关键字最小的记录R[k],将它与无序区的第1个记录R[1]交换,使R[1..1]和R[2..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。

……

③第i趟排序

第i趟排序开始时,当前有序区和无序区分别为R[1..i-1]和R(1≤i≤n-1)。该趟排序从当前无序区中选出关键字最小的记录 R[k],将它与无序区的第1个记录R交换,使R[1..i]和R分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。

这样,n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果。

算法实现

  1. public class SelectSortTest {
  2. public static void main(String[] args) {
  3. int[] data = new int[] { 536219487 };
  4. print(data);
  5. selectSort(data);
  6. print(data);
  7. }
  8. public static void swap(int[] data, int i, int j) {
  9. if (i == j) {
  10. return;
  11. }
  12. data[i] = data[i] + data[j];
  13. data[j] = data[i] - data[j];
  14. data[i] = data[i] - data[j];
  15. }
  16. public static void selectSort(int[] data) {
  17. for (int i = 0; i < data.length - 1; i++) {
  18. int minIndex = i; // 记录最小值的索引
  19. for (int j = i + 1; j < data.length; j++) {
  20. if (data[j] < data[minIndex]) {
  21. minIndex = j; // 若后面的元素值小于最小值,将j赋值给minIndex
  22. }
  23. }
  24. if (minIndex != i) {
  25. swap(data, i, minIndex);
  26. print(data);
  27. }
  28. }
  29. }
  30. public static void print(int[] data) {
  31. for (int i = 0; i < data.length; i++) {
  32. System.out.print(data[i] + "\t");
  33. }
  34. System.out.println();
  35. }
  36. }

运行结果:

  1. 5 3 6 2 1 9 4 8 7
  2. 1 3 6 2 5 9 4 8 7
  3. 1 2 6 3 5 9 4 8 7
  4. 1 2 3 6 5 9 4 8 7
  5. 1 2 3 4 5 9 6 8 7
  6. 1 2 3 4 5 6 9 8 7
  7. 1 2 3 4 5 6 7 8 9
  8. 1 2 3 4 5 6 7 8 9

Java排序算法(三):堆排序

堆积排序(Heapsort)是指利用堆积树(堆)这种资料结构所设计的一种排序算法,可以利用数组的特点快速定位指定索引的元素。堆排序是不稳定的排序方法,辅助空间为O(1), 最坏时间复杂度为O(nlog2n) ,堆排序的堆序的平均性能较接近于最坏性能。

堆排序利用了大根堆(或小根堆)堆顶记录的关键字最大(或最小)这一特征,使得在当前无序区中选取最大(或最小)关键字的记录变得简单。

(1)用大根堆排序的基本思想

① 先将初始文件R[1..n]建成一个大根堆,此堆为初始的无序区

② 再将关键字最大的记录R[1](即堆顶)和无序区的最后一个记录R[n]交换,由此得到新的无序区R[1..n-1]和有序区R[n],且满足R[1..n-1].keys≤R[n].key

③由于交换后新的根R[1]可能违反堆性质,故应将当前无序区R[1..n-1]调整为堆。然后再次将R[1..n-1]中关键字最大的记录R[1]和该区间的最后一个记录R[n-1]交换,由此得到新的无序区R[1..n-2]和有序区R[n-1..n],且仍满足关系R[1..n-2].keys≤R[n-1..n].keys,同样要将R[1..n-2]调整为堆。

……

直到无序区只有一个元素为止。

(2)大根堆排序算法的基本操作:

① 初始化操作:将R[1..n]构造为初始堆;

② 每一趟排序的基本操作:将当前无序区的堆顶记录R[1]和该区间的最后一个记录交换,然后将新的无序区调整为堆(亦称重建堆)。

注意:

①只需做n-1趟排序,选出较大的n-1个关键字即可以使得文件递增有序。

②用小根堆排序与利用大根堆类似,只不过其排序结果是递减有序的。堆排序和直接选择排序相反:在任何时刻堆排序中无序区总是在有序区之前,且有序区是在原向量的尾部由后往前逐步扩大至整个向量为止。

代码实现:

  1. public class HeapSortTest {
  2. public static void main(String[] args) {
  3. int[] data5 = new int[] { 536219487 };
  4. print(data5);
  5. heapSort(data5);
  6. System.out.println("排序后的数组:");
  7. print(data5);
  8. }
  9. public static void swap(int[] data, int i, int j) {
  10. if (i == j) {
  11. return;
  12. }
  13. data[i] = data[i] + data[j];
  14. data[j] = data[i] - data[j];
  15. data[i] = data[i] - data[j];
  16. }
  17. public static void heapSort(int[] data) {
  18. for (int i = 0; i < data.length; i++) {
  19. createMaxdHeap(data, data.length - 1 - i);
  20. swap(data, 0, data.length - 1 - i);
  21. print(data);
  22. }
  23. }
  24. public static void createMaxdHeap(int[] data, int lastIndex) {
  25. for (int i = (lastIndex - 1) / 2; i >= 0; i--) {
  26. // 保存当前正在判断的节点
  27. int k = i;
  28. // 若当前节点的子节点存在
  29. while (2 * k + 1 <= lastIndex) {
  30. // biggerIndex总是记录较大节点的值,先赋值为当前判断节点的左子节点
  31. int biggerIndex = 2 * k + 1;
  32. if (biggerIndex < lastIndex) {
  33. // 若右子节点存在,否则此时biggerIndex应该等于 lastIndex
  34. if (data[biggerIndex] < data[biggerIndex + 1]) {
  35. // 若右子节点值比左子节点值大,则biggerIndex记录的是右子节点的值
  36. biggerIndex++;
  37. }
  38. }
  39. if (data[k] < data[biggerIndex]) {
  40. // 若当前节点值比子节点最大值小,则交换2者得值,交换后将biggerIndex值赋值给k
  41. swap(data, k, biggerIndex);
  42. k = biggerIndex;
  43. else {
  44. break;
  45. }
  46. }
  47. }
  48. }
  49. public static void print(int[] data) {
  50. for (int i = 0; i < data.length; i++) {
  51. System.out.print(data[i] + "\t");
  52. }
  53. System.out.println();
  54. }
  55. }


运行结果:

  1. 5 3 6 2 1 9 4 8 7
  2. 3 8 6 7 1 5 4 2 9
  3. 2 7 6 3 1 5 4 8 9
  4. 4 3 6 2 1 5 7 8 9
  5. 4 3 5 2 1 6 7 8 9
  6. 1 3 4 2 5 6 7 8 9
  7. 2 3 1 4 5 6 7 8 9
  8. 1 2 3 4 5 6 7 8 9
  9. 1 2 3 4 5 6 7 8 9
  10. 1 2 3 4 5 6 7 8 9
  11. 排序后的数组:
  12. 1 2 3 4 5 6 7 8 9


Java排序算法(四):冒泡排序

冒泡排序是计算机的一种排序方法,它的时间复杂度为O(n^2),虽然不及堆排序、快速排序的O(nlogn,底数为2),但是有两个优点:

1.“编程复杂度”很低,很容易写出代码;

2.具有稳定性,这里的稳定性是指原序列中相同元素的相对顺序仍然保持到排序后的序列,而堆排序、快速排序均不具有稳定性。

不过,一路、二路归并排序、不平衡二叉树排序的速度均比冒泡排序快,且具有稳定性,但速度不及堆排序、快速排序。冒泡排序是经过n-1趟子排序完成的,第i趟子排序从第1个数至第n-i个数,若第i个数比后一个数大(则升序,小则降序)则交换两数。

冒泡排序算法稳定,O(1)的额外的空间,比较和交换的时间复杂度都是O(n^2),自适应,对于已基本排序的算法,时间复杂度为O(n)。冒泡算法的许多性质和插入算法相似,但对于系统开销高一点点。

排序过程

设想被排序的数组R[1..N]垂直竖立,将每个数据元素看作有重量的气泡,根据轻气泡不能在重气泡之下的原则,从下往上扫描数组R,凡扫描到违反本原则的轻气泡,就使其向上"漂浮",如此反复进行,直至最后任何两个气泡都是轻者在上,重者在下为止。

代码实现

  1. public class BubbleSortTest {
  2. public static void main(String[] args) {
  3. int[] data5 = new int[] { 536219487};
  4. print(data5);
  5. bubbleSort(data5);
  6. System.out.println("排序后的数组:");
  7. print(data5);
  8. }
  9. public static void swap(int[] data, int i, int j) {
  10. if (i == j) {
  11. return;
  12. }
  13. data[i] = data[i] + data[j];
  14. data[j] = data[i] - data[j];
  15. data[i] = data[i] - data[j];
  16. }
  17. public static void bubbleSort(int[] data) {
  18. for (int i = 0; i < data.length - 1; i++) {
  19. // 记录某趟是否发生交换,若为false表示数组已处于有序状态
  20. boolean isSorted = false;
  21. for (int j = 0; j < data.length - i - 1; j++) {
  22. if (data[j] > data[j + 1]) {
  23. swap(data, j, j + 1);
  24. isSorted = true;
  25. print(data);
  26. }
  27. }
  28. if (!isSorted) {
  29. // 若数组已处于有序状态,结束循环
  30. break;
  31. }
  32. }
  33. }
  34. public static void print(int[] data) {
  35. for (int i = 0; i < data.length; i++) {
  36. System.out.print(data[i] + "\t");
  37. }
  38. System.out.println();
  39. }
  40. }


运行结果

  1. 5 3 6 2 1 9 4 8 7
  2. 3 5 6 2 1 9 4 8 7
  3. 3 5 2 6 1 9 4 8 7
  4. 3 5 2 1 6 9 4 8 7
  5. 3 5 2 1 6 4 9 8 7
  6. 3 5 2 1 6 4 8 9 7
  7. 3 5 2 1 6 4 8 7 9
  8. 3 2 5 1 6 4 8 7 9
  9. 3 2 1 5 6 4 8 7 9
  10. 3 2 1 5 4 6 8 7 9
  11. 3 2 1 5 4 6 7 8 9
  12. 2 3 1 5 4 6 7 8 9
  13. 2 1 3 5 4 6 7 8 9
  14. 2 1 3 4 5 6 7 8 9
  15. 1 2 3 4 5 6 7 8 9
  16. 排序后的数组:
  17. 1 2 3 4 5 6 7 8 9

Java排序算法(五):快速排序

快速排序是一个速度非常快的交换排序算法,它的基本思路很简单,从待排的数据序列中任取一个数据(如第一个数据)作为分界值,所有比它小的数据元素放到左边,所有比它大的数据元素放到它的右边。经过这样一趟下来,该序列形成左右两个子序列,左边序列中的数据元素的值都比分界值小,右边序列中数据元素的值都比分界值大。
接下来对左右两个子序列进行递归排序,对两个子序列重新选择中心元素并依此规则调整,直到每个元素子表的元素只剩下一个元素,排序完成。

思路:
1.定义一个i变量,i变量从左边第一个索引开始,找大于分界值的元素的索引,并用i来记录它。
2.定义一个j变量,j变量从右边第一个索引开始,找小于分界值的元素的索引,并用j来记录它。
3.如果i<j,交换i,j两个索引处的元素。
重复执行以上1,2,3步,直到i>=j,可以判断j左边的数据元素都小于分界值,j右边的数据元素都大于分界值,最后将分界值和j索引处的元素交换即可。

时间复杂度
最好情况(每次总是选到中间值作枢轴)T(n)=O(nlogn)
最坏情况(每次总是选到最小或最大元素作枢轴)
做n-1趟,每趟比较n-i次,总的比较次数最大:[O(n²)]
平均时间复杂度为::T(n)=O(nlogn)

代码实现:

  1. package sort;
  2. public class QuickSortTest {
  3. public static void main(String[] args) {
  4. int[] data = new int[] { 536219487 };
  5. print(data);
  6. quickSort(data, 0, data.length - 1);
  7. System.out.println("排序后的数组:");
  8. print(data);
  9. }
  10. public static void swap(int[] data, int i, int j) {
  11. if (i == j) {
  12. return;
  13. }
  14. data[i] = data[i] + data[j];
  15. data[j] = data[i] - data[j];
  16. data[i] = data[i] - data[j];
  17. }
  18. public static void quickSort(int[] data, int start, int end) {
  19. if (start >= end)
  20. return;
  21. //以起始索引为分界点
  22. int pivot = data[start];
  23. int i = start + 1;
  24. int j = end;
  25. while (true) {
  26. while (i <= end && data[i] < pivot) {
  27. i++;
  28. }
  29. while (j > start && data[j] > pivot) {
  30. j--;
  31. }
  32. if (i < j) {
  33. swap(data, i, j);
  34. else {
  35. break;
  36. }
  37. }
  38. //交换 j和分界点的值
  39. swap(data, start, j);
  40. print(data);
  41. //递归左子序列
  42. quickSort(data, start, j - 1);
  43. //递归右子序列
  44. quickSort(data, j + 1, end);
  45. }
  46. public static void print(int[] data) {
  47. for (int i = 0; i < data.length; i++) {
  48. System.out.print(data[i] + "\t");
  49. }
  50. System.out.println();
  51. }
  52. }


运行结果:

  1. 5 3 6 2 1 9 4 8 7
  2. 1 3 4 2 5 9 6 8 7
  3. 1 3 4 2 5 9 6 8 7
  4. 1 2 3 4 5 9 6 8 7
  5. 1 2 3 4 5 7 6 8 9
  6. 1 2 3 4 5 6 7 8 9
  7. 排序后的数组:
  8. 1 2 3 4 5 6 7 8 9



Java排序算法(六):直接插入排序

直接插入排序的基本操作就是将待排序的数据元素按其关键字值的大小插入到前面的有序序列中。

直接插入的时间效率并不高,如果在最坏的情况下,所有元素的比较次数总和为(0+1+...+n-1)=O(n^2)。其他情况下也要考虑移动元素的次数,故时间复杂度为O(n^2)

直接插入空间效率很好,只需要1个缓存数据单元,也就是说空间复杂度为O(1).

直接插入排序是稳定的。

直接插入排序在数据已有一定顺序的情况下,效率较好。但如果数据无规则,则需要移动大量的数据,其效率就与冒泡排序法和选择排序法一样差了。

算法描述

对一个有n个元素的数据序列,排序需要进行n-1趟插入操作:

第1趟插入,将第2个元素插入前面的有序子序列--此时前面只有一个元素,当然是有序的。

第2趟插入,将第3个元素插入前面的有序子序列,前面2个元素是有序的。

第n-1趟插入,将第n个元素插入前面的有序子序列,前面n-1个元素是有序的。

代码实现

  1. package sort;
  2. public class InsertSortTest {
  3. public static int count = 0;
  4. public static void main(String[] args) {
  5. int[] data = new int[] { 536219487 };
  6. print(data);
  7. insertSort(data);
  8. print(data);
  9. }
  10. public static void insertSort(int[] data) {
  11. for (int i = 1; i < data.length; i++) {
  12. // 缓存i处的元素值
  13. int tmp = data[i];
  14. if (data[i] < data[i - 1]) {
  15. int j = i - 1;
  16. // 整体后移一格
  17. while (j >= 0 && data[j] > tmp) {
  18. data[j + 1] = data[j];
  19. j--;
  20. }
  21. // 最后将tmp插入合适的位置
  22. data[j + 1] = tmp;
  23. print(data);
  24. }
  25. }
  26. }
  27. public static void print(int[] data) {
  28. for (int i = 0; i < data.length; i++) {
  29. System.out.print(data[i] + "\t");
  30. }
  31. System.out.println();
  32. }
  33. }


运行结果:

  1. 5 3 6 2 1 9 4 8 7
  2. 3 5 6 2 1 9 4 8 7
  3. 2 3 5 6 1 9 4 8 7
  4. 1 2 3 5 6 9 4 8 7
  5. 1 2 3 4 5 6 9 8 7
  6. 1 2 3 4 5 6 8 9 7
  7. 1 2 3 4 5 6 7 8 9
  8. 1 2 3 4 5 6 7 8 9


Java排序算法(七):折半插入排序

折半插入排序法,又称二分插入排序法,是直接插入排序法的改良版,也需要执行i-1趟插入,不同之处在于,第i趟插入,先找出第i+1个元素应该插入的的位置,假定前i个数据是已经处于有序状态。

代码实现:

  1. package sort;
  2. public class BinaryInsertSortTest {
  3. public static int count = 0;
  4. public static void main(String[] args) {
  5. int[] data = new int[] { 536219487 };
  6. print(data);
  7. binaryInsertSort(data);
  8. print(data);
  9. }
  10. public static void binaryInsertSort(int[] data) {
  11. for (int i = 1; i < data.length; i++) {
  12. if (data[i] < data[i - 1]) {
  13. // 缓存i处的元素值
  14. int tmp = data[i];
  15. // 记录搜索范围的左边界
  16. int low = 0;
  17. // 记录搜索范围的右边界
  18. int high = i - 1;
  19. while (low <= high) {
  20. // 记录中间位置
  21. int mid = (low + high) / 2;
  22. // 比较中间位置数据和i处数据大小,以缩小搜索范围
  23. if (data[mid] < tmp) {
  24. low = mid + 1;
  25. else {
  26. high = mid - 1;
  27. }
  28. }
  29. //将low~i处数据整体向后移动1位
  30. for (int j = i; j > low; j--) {
  31. data[j] = data[j - 1];
  32. }
  33. data[low] = tmp;
  34. print(data);
  35. }
  36. }
  37. }
  38. public static void print(int[] data) {
  39. for (int i = 0; i < data.length; i++) {
  40. System.out.print(data[i] + "\t");
  41. }
  42. System.out.println();
  43. }
  44. }


运行结果:

  1. 5 3 6 2 1 9 4 8 7
  2. 3 5 6 2 1 9 4 8 7
  3. 2 3 5 6 1 9 4 8 7
  4. 1 2 3 5 6 9 4 8 7
  5. 1 2 3 4 5 6 9 8 7
  6. 1 2 3 4 5 6 8 9 7
  7. 1 2 3 4 5 6 7 8 9
  8. 1 2 3 4 5 6 7 8 9


Java排序算法(八):希尔排序(Shell排序)

希尔排序(缩小增量法) 属于插入类排序,由Shell提出,希尔排序对直接插入排序进行了简单的改进:它通过加大插入排序中元素之间的间隔,并在这些有间隔的元素中进行插入排序,从而使数据项大跨度地移动,当这些数据项排过一趟序之后,希尔排序算法减小数据项的间隔再进行排序,依次进行下去,进行这些排序时的数据项之间的间隔被称为增量,习惯上用字母h来表示这个增量。

常用的h序列由Knuth提出,该序列从1开始,通过如下公式产生:

h = 3 * h +1

反过来程序需要反向计算h序列,应该使用

h=(h-1)/3

代码实现:

  1. package sort;
  2. public class ShellSortTest {
  3. public static int count = 0;
  4. public static void main(String[] args) {
  5. int[] data = new int[] { 536219487 };
  6. print(data);
  7. shellSort(data);
  8. print(data);
  9. }
  10. public static void shellSort(int[] data) {
  11. // 计算出最大的h值
  12. int h = 1;
  13. while (h <= data.length / 3) {
  14. h = h * 3 + 1;
  15. }
  16. while (h > 0) {
  17. for (int i = h; i < data.length; i += h) {
  18. if (data[i] < data[i - h]) {
  19. int tmp = data[i];
  20. int j = i - h;
  21. while (j >= 0 && data[j] > tmp) {
  22. data[j + h] = data[j];
  23. j -= h;
  24. }
  25. data[j + h] = tmp;
  26. print(data);
  27. }
  28. }
  29. // 计算出下一个h值
  30. h = (h - 1) / 3;
  31. }
  32. }
  33. public static void print(int[] data) {
  34. for (int i = 0; i < data.length; i++) {
  35. System.out.print(data[i] + "\t");
  36. }
  37. System.out.println();
  38. }
  39. }


运行结果:

  1. 5 3 6 2 1 9 4 8 7
  2. 1 3 6 2 5 9 4 8 7
  3. 1 2 3 6 5 9 4 8 7
  4. 1 2 3 5 6 9 4 8 7
  5. 1 2 3 4 5 6 9 8 7
  6. 1 2 3 4 5 6 8 9 7
  7. 1 2 3 4 5 6 7 8 9
  8. 1 2 3 4 5 6 7 8 9


上面程序在和直接插入法比较,会发现其与直接插入排序的差别在于:直接插入排序中的h会以1代替

Shell排序是不稳定的,它的空间开销也是O(1),时间开销估计在O(N3/2)~O(N7/6)之间



Java排序算法(九):归并排序

归并排序(Merge)是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列。

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。 将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为2-路归并。

归并排序算法稳定,数组需要O(n)的额外空间,链表需要O(log(n))的额外空间,时间复杂度为O(nlog(n)),算法不是自适应的,不需要对数据的随机读取。

工作原理:

1、申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列

2、设定两个指针,最初位置分别为两个已经排序序列的起始位置

3、比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置

4、重复步骤3直到某一指针达到序列尾

5、将另一序列剩下的所有元素直接复制到合并序列尾

代码实现:

  1. public class MergeSortTest {
  2. public static void main(String[] args) {
  3. int[] data = new int[] { 536219487 };
  4. print(data);
  5. mergeSort(data);
  6. System.out.println("排序后的数组:");
  7. print(data);
  8. }
  9. public static void mergeSort(int[] data) {
  10. sort(data, 0, data.length - 1);
  11. }
  12. public static void sort(int[] data, int left, int right) {
  13. if (left >= right)
  14. return;
  15. // 找出中间索引
  16. int center = (left + right) / 2;
  17. // 对左边数组进行递归
  18. sort(data, left, center);
  19. // 对右边数组进行递归
  20. sort(data, center + 1, right);
  21. // 合并
  22. merge(data, left, center, right);
  23. print(data);
  24. }
  25. /**
  26. * 将两个数组进行归并,归并前面2个数组已有序,归并后依然有序
  27. *
  28. * @param data
  29. * 数组对象
  30. * @param left
  31. * 左数组的第一个元素的索引
  32. * @param center
  33. * 左数组的最后一个元素的索引,center+1是右数组第一个元素的索引
  34. * @param right
  35. * 右数组最后一个元素的索引
  36. */
  37. public static void merge(int[] data, int left, int center, int right) {
  38. // 临时数组
  39. int[] tmpArr = new int[data.length];
  40. // 右数组第一个元素索引
  41. int mid = center + 1;
  42. // third 记录临时数组的索引
  43. int third = left;
  44. // 缓存左数组第一个元素的索引
  45. int tmp = left;
  46. while (left <= center && mid <= right) {
  47. // 从两个数组中取出最小的放入临时数组
  48. if (data[left] <= data[mid]) {
  49. tmpArr[third++] = data[left++];
  50. else {
  51. tmpArr[third++] = data[mid++];
  52. }
  53. }
  54. // 剩余部分依次放入临时数组(实际上两个while只会执行其中一个)
  55. while (mid <= right) {
  56. tmpArr[third++] = data[mid++];
  57. }
  58. while (left <= center) {
  59. tmpArr[third++] = data[left++];
  60. }
  61. // 将临时数组中的内容拷贝回原数组中
  62. // (原left-right范围的内容被复制回原数组)
  63. while (tmp <= right) {
  64. data[tmp] = tmpArr[tmp++];
  65. }
  66. }
  67. public static void print(int[] data) {
  68. for (int i = 0; i < data.length; i++) {
  69. System.out.print(data[i] + "\t");
  70. }
  71. System.out.println();
  72. }
  73. }


运行结果:

  1. 5 3 6 2 1 9 4 8 7
  2. 3 5 6 2 1 9 4 8 7
  3. 3 5 6 2 1 9 4 8 7
  4. 3 5 6 1 2 9 4 8 7
  5. 1 2 3 5 6 9 4 8 7
  6. 1 2 3 5 6 4 9 8 7
  7. 1 2 3 5 6 4 9 7 8
  8. 1 2 3 5 6 4 7 8 9
  9. 1 2 3 4 5 6 7 8 9
  10. 排序后的数组:
  11. 1 2 3 4 5 6 7 8 9

Java排序算法(十):桶式排序

桶式排序不再是一种基于比较的排序方法,它是一种比较巧妙的排序方式,但这种排序方式需要待排序的序列满足以下两个特征:

待排序列所有的值处于一个可枚举的范围之类;

待排序列所在的这个可枚举的范围不应该太大,否则排序开销太大。

排序的具体步骤如下:

(1)对于这个可枚举范围构建一个buckets数组,用于记录“落入”每个桶中元素的个数;

(2)将(1)中得到的buckets数组重新进行计算,按如下公式重新计算:

buckets[i] = buckets[i] +buckets[i-1] (其中1<=i<buckets.length);

桶式排序是一种非常优秀的排序算法,时间效率极高,它只要通过2轮遍历:第1轮遍历待排数据,统计每个待排数据“落入”各桶中的个数,第2轮遍历buckets用于重新计算buckets中元素的值,2轮遍历后就可以得到每个待排数据在有序序列中的位置,然后将各个数据项依次放入指定位置即可。

桶式排序的空间开销较大,它需要两个数组,第1个buckets数组用于记录“落入”各桶中元素的个数,进而保存各元素在有序序列中的位置,第2个数组用于缓存待排数据。

桶式排序是稳定的。

如果待排序数据的范围在0~k之间,那么它的时间复杂度是O(k+n)的

桶式排序算法速度很快,因为它的时间复杂度是O(k+n),而基于交换的排序时间上限是nlg n。

但是它的限制多,比如它只能排整形数组。而且当k较大,而数组长度n较小,即k>>n时,辅助数组C[k+1]的空间消耗较大。

当数组为整形,且k和n接近时, 可以用此方法排序。(有的文章也称这种排序算法为“计数排序”)

代码实现:

  1. public class BucketSortTest {
  2. public static int count = 0;
  3. public static void main(String[] args) {
  4. int[] data = new int[] { 536219487 };
  5. print(data);
  6. bucketSort(data, 010);
  7. print(data);
  8. }
  9. public static void bucketSort(int[] data, int min, int max) {
  10. // 缓存数组
  11. int[] tmp = new int[data.length];
  12. // buckets用于记录待排序元素的信息
  13. // buckets数组定义了max-min个桶
  14. int[] buckets = new int[max - min];
  15. // 计算每个元素在序列出现的次数
  16. for (int i = 0; i < data.length; i++) {
  17. buckets[data[i] - min]++;
  18. }
  19. // 计算“落入”各桶内的元素在有序序列中的位置
  20. for (int i = 1; i < max - min; i++) {
  21. buckets[i] = buckets[i] + buckets[i - 1];
  22. }
  23. // 将data中的元素完全复制到tmp数组中
  24. System.arraycopy(data, 0, tmp, 0, data.length);
  25. // 根据buckets数组中的信息将待排序列的各元素放入相应位置
  26. for (int k = data.length - 1; k >= 0; k--) {
  27. data[--buckets[tmp[k] - min]] = tmp[k];
  28. }
  29. }
  30. public static void print(int[] data) {
  31. for (int i = 0; i < data.length; i++) {
  32. System.out.print(data[i] + "\t");
  33. }
  34. System.out.println();
  35. }
  36. }


运行结果:

  1. 5 3 6 2 1 9 4 8 7
  2. 1 2 3 4 5 6 7 8 9

Java排序算法(十一):基数排序

基数排序已经不再是一种常规的排序方式,它更多地像一种排序方法的应用,基数排序必须依赖于另外的排序方法。基数排序的总体思路就是将待排序数据拆分成多个关键字进行排序,也就是说,基数排序的实质是多关键字排序。

多关键字排序的思路是将待排数据里德排序关键字拆分成多个排序关键字;第1个排序关键字,第2个排序关键字,第3个排序关键字......然后,根据子关键字对待排序数据进行排序。

多关键字排序时有两种解决方案:

最高位优先法(MSD)(Most Significant Digit first)

最低位优先法(LSD)(Least Significant Digit first)

例如,对如下数据序列进行排序。

192,221,12,23

可以观察到它的每个数据至多只有3位,因此可以将每个数据拆分成3个关键字:百位(高位)、十位、个位(低位)。

如果按照习惯思维,会先比较百位,百位大的数据大,百位相同的再比较十位,十位大的数据大;最后再比较个位。人得习惯思维是最高位优先方式。

如果按照人得思维方式,计算机实现起来有一定的困难,当开始比较十位时,程序还需要判断它们的百位是否相同--这就认为地增加了难度,计算机通常会选择最低位优先法。

基数排序方法对任一子关键字排序时必须借助于另一种排序方法,而且这种排序方法必须是稳定的。

对于多关键字拆分出来的子关键字,它们一定位于0-9这个可枚举的范围内,这个范围不大,因此用桶式排序效率非常好。

对于多关键字排序来说,程序将待排数据拆分成多个子关键字后,对子关键字排序既可以使用桶式排序,也可以使用任何一种稳定的排序方法。

代码实现:

  1. import java.util.Arrays;
  2. public class MultiKeyRadixSortTest {
  3. public static void main(String[] args) {
  4. int[] data = new int[] { 11001922211223 };
  5. print(data);
  6. radixSort(data, 104);
  7. System.out.println("排序后的数组:");
  8. print(data);
  9. }
  10. public static void radixSort(int[] data, int radix, int d) {
  11. // 缓存数组
  12. int[] tmp = new int[data.length];
  13. // buckets用于记录待排序元素的信息
  14. // buckets数组定义了max-min个桶
  15. int[] buckets = new int[radix];
  16. for (int i = 0, rate = 1; i < d; i++) {
  17. // 重置count数组,开始统计下一个关键字
  18. Arrays.fill(buckets, 0);
  19. // 将data中的元素完全复制到tmp数组中
  20. System.arraycopy(data, 0, tmp, 0, data.length);
  21. // 计算每个待排序数据的子关键字
  22. for (int j = 0; j < data.length; j++) {
  23. int subKey = (tmp[j] / rate) % radix;
  24. buckets[subKey]++;
  25. }
  26. for (int j = 1; j < radix; j++) {
  27. buckets[j] = buckets[j] + buckets[j - 1];
  28. }
  29. // 按子关键字对指定的数据进行排序
  30. for (int m = data.length - 1; m >= 0; m--) {
  31. int subKey = (tmp[m] / rate) % radix;
  32. data[--buckets[subKey]] = tmp[m];
  33. }
  34. rate *= radix;
  35. }
  36. }
  37. public static void print(int[] data) {
  38. for (int i = 0; i < data.length; i++) {
  39. System.out.print(data[i] + "\t");
  40. }
  41. System.out.println();
  42. }
  43. }


运行结果:

  1. 1100 192 221 12 23
  2. 排序后的数组:
  3. 12 23 192 221 1100



Java排序算法(十二):总结

前面讲了10种基本的排序算法,现在来作下总结,基于下面几个方面来比较各个排序算法的优劣:

时间复杂度,空间复杂度,稳定性,适用场景

排序算法时间复杂度空间复杂度稳定性适用场景
直接选择排序O(n^2)O(1)不稳定时间效率不高,但是空间效率很高,算法实现比较简单
堆排序O(nlogn),底数为2O(1)不稳定时间效率很高,但是不稳定
冒泡排序O(n^2)O(1)稳定算法实现比较简单,稳定,且对于已基本排序的数据排序,时间复杂度为O(n)
快速排序最好O(nlogn),底数为2 
最坏O(n^2)
平均O(nlogn),底数为2
O(logn),底数为2不稳定时间效率很高,但是不稳定
直接插入排序O(n^2)O(1)稳定 
折半插入排序O(n^2)O(1)稳定时间效率比直接插入排序要好
希尔排序O(n(logn)^2),底数为2O(1)不稳定 
归并排序O(nlogn),底数为2O(n)稳定空间复杂度较高
桶式排序O(k+n)O(k+n)稳定待排序数据的范围在0~k之间,只能为整形序列
基数排序  稳定依赖子关键字排序算法,子关键字排序算法必须是稳定的



稳定性分析

   首先,排序算法的稳定性大家应该都知道,通俗地讲就是能保证排序前2个相等的数其在序列的前后位置顺序和排序后它们两个的前后位置顺序相同。在简单形式化一下,如果Ai = Aj, Ai原来在位置前,排序后Ai还是要在Aj位置前。

     其次,说一下稳定性的好处。排序算法如果是稳定的,那么从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。基数排序就是这样,先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。另外,如果排序算法稳定,对基于比较的排序算法而言,元素交换的次数可能会少一些(个人感觉,没有证实)。

     回到主题,现在分析一下常见的排序算法的稳定性,每个都给出简单的理由。

   (1)冒泡排序

        冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较,交换也发生在这两个元素之间。所以,如果两个元素相等,我想你是不会再无聊地把他们俩交换一下的;如果两个相等的元素没有相邻,那么即使通过前面的两两交换把两个相邻起来,这时候也不会交换,所以相同元素的前后顺序并没有改变,所以冒泡排序是一种稳定排序算法。

(2)选择排序

      选择排序是给每个位置选择当前元素最小的,比如给第一个位置选择最小的,在剩余元素里面给第二个元素选择第二小的,依次类推,直到第n-1个元素,第n个元素不用选择了,因为只剩下它一个最大的元素了。那么,在一趟选择,如果当前元素比一个元素小,而该小的元素又出现在一个和当前元素相等的元素后面,那么交换后稳定性就被破坏了。比较拗口,举个例子,序列5 8 5 2 9, 我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了,所以选择排序不是一个稳定的排序算法。

(3)插入排序
     插入排序是在一个已经有序的小序列的基础上,一次插入一个元素。当然,刚开始这个有序的小序列只有1个元素,就是第一个元素。比较是从有序序列的末尾开始,也就是想要插入的元素和已经有序的最大者开始比起,如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。

(4)快速排序
    快速排序有两个方向,左边的i下标一直往右走,当a[i] <= a[center_index],其中center_index是中枢元素的数组下标,一般取为数组第0个元素。而右边的j下标一直往左走,当a[j] > a[center_index]。如果i和j都走不动了,i <= j, 交换a[i]和a[j],重复上面的过程,直到i>j。 交换a[j]和a[center_index],完成一趟快速排序。在中枢元素和a[j]交换的时候,很有可能把前面的元素的稳定性打乱,比如序列为 5 3 3 4 3 8 9 10 11, 现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱,所以快速排序是一个不稳定的排序算法,不稳定发生在中枢元素和a[j]交换的时刻。

(5)归并排序
    归并排序是把序列递归地分成短序列,递归出口是短序列只有1个元素(认为直接有序)或者2个序列(1次比较和交换),然后把各个有序的段序列合并成一个有序的长序列,不断合并直到原序列全部排好序。可以发现,在1个或2个元素时,1个元素不会交换,2个元素如果大小相等也没有人故意交换,这不会破坏稳定性。那么,在短的有序序列合并的过程中,稳定是是否受到破坏?没有,合并过程中我们可以保证如果两个当前元素相等时,我们把处在前面的序列的元素保存在结果序列的前面,这样就保证了稳定性。所以,归并排序也是稳定的排序算法。

(6)基数排序
   基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序,最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以其是稳定的排序算法。

(7)希尔排序(shell)
    希尔排序是按照不同步长对元素进行插入排序,当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;当元素基本有序了,步长很小,插入排序对于有序的序列效率很高。所以,希尔排序的时间复杂度会比o(n^2)好一些。由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。

(8)堆排序
   我们知道堆的结构是节点i的孩子为2*i和2*i+1节点,大顶堆要求父节点大于等于其2个子节点,小顶堆要求父节点小于等于其2个子节点。在一个长为n的序列,堆排序的过程是从第n/2开始和其子节点共3个值选择最大(大顶堆)或者最小(小顶堆),这3个元素之间的选择当然不会破坏稳定性。但当为n/2-1, n/2-2, ...1这些个父节点选择元素时,就会破坏稳定性。有可能第n/2个父节点交换把后面一个元素交换过去了,而第n/2-1个父节点把后面一个相同的元素没有交换,那么这2个相同的元素之间的稳定性就被破坏了。所以,堆排序不是稳定的排序算法。



  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值