排序算法

根据尚硅谷的韩顺平老师的数据结构视频总结的笔记

观看视频的网址

 

一、排序算法的介绍

排序也称排序算法 (Sort Algorithm),排序是将一 组数据,依指定的顺序进行排列的过程。

 

二、排序的分类

1) 内部排序:

指将需要处理的所有数据都加载 到内部存储器中进行排序。

2) 外部排序法:

数据量过大,无法全部加载到内 存中,需要借助外部存储进行排序。

3) 常见的排序算法分类(见下图):

 

三、算法的时间复杂度

1、度量一个程序(算法)执行时间的两种方法

1)事后统计的方法

这种方法可行, 但是有两个问题:一是要想对设计的算法的运行性能进行评测,需要实际运行该程序;二是所得时间的统计量依赖于计算机的硬件、软件等环境因素, 这种方式,要在同一台计算机的相同状态下运行,才能比较那个算法速度更快。

2)事前估算的方法

通过分析某个算法的时间复杂度来判断哪个算法更优.

 

2、时间频度

一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)

 

3、时间复杂度

一般情况下,算法中的基本操作语句的重复执行次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n) / f(n) 的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作 T(n)=O( f(n) ),称O( f(n) )  为算法的渐进时间复杂度,简称时间复杂度。

T(n) 不同,但时间复杂度可能相同。 如:T(n)=n²+7n+6 与 T(n)=3n²+2n+2 它们的T(n) 不同,但时间复杂度相同,都为O(n²)。

计算时间复杂度的方法:

  • 用常数1代替运行时间中的所有加法常数       T(n)=n²+7n+6  => T(n)=n²+7n+1
  • 修改后的运行次数函数中,只保留最高阶项        T(n)=n²+7n+1 => T(n) = n²
  • 去除最高阶项的系数         T(n) = n² => T(n) = n² => O(n²)

 

常见的时间复杂度:

常数阶O(1)

对数阶O(log2n)

线性阶O(n)

线性对数阶O(nlog2n)

平方阶O(n^2)

立方阶O(n^3)

k次方阶O(n^k)

指数阶O(2^n)

 

常见的算法时间复杂度由小到大依次为:Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)< Ο(nk) <Ο(2n) ,随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越低

 

4、平均时间复杂度和最坏时间复杂度

1)平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间。

2)最坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。 这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长。

3)平均时间复杂度和最坏时间复杂度是否一致,和算法有关

 

四、算法的空间复杂度

  • 类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)定义为该算法所耗费的存储空间,它也是问题规模n的函数。
  • 空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模n有关,它随着n的增大而增大,当n较大时,将占用较多的存储单元,例如快速排序归并排序算法就属于这种情况
  • 在做算法分析时,主要讨论的是时间复杂度。从用户使用体验上看,更看重的程序执行的速度。一些缓存产品(redis, memcache)和算法(基数排序)本质就是用空间换时间.

 

五、冒泡排序

冒泡排序(Bubble Sorting)的基本思想是:通过对待排序序列从前向后(从下标较小的元素开始),依次比较相邻元素的值,若发现逆序则交换,使值较大的元素逐渐从前移向后部,就象水底下的气泡一样逐渐向上冒。

优化:

因为排序的过程中,各元素不断接近自己的位置,如果一趟比较下来没有进行过交换,就说明序列有序,因此要在排序过程中设置一个标志flag判断元素是否进行过交换。从而减少不必要的比较。(这里说的优化,可以在冒泡排序写好后,在进行)

 

图解演示示例:

 

代码实现:

package sorting;

import java.util.Arrays;

/**
 * @description:   冒泡排序
 * @auther:田坤
 * @date 2020/10/8 9:35
 **/
public class dubbleSorting {
    public static void main(String[] args) {
        int[] arr = {43, 13, -2, 98, -4};
        //dubble(arr);

        //测试八万个数据的冒泡排序 O(n^2)
        int[] arr2 = new int[80000];
        for(int i = 0 ; i < arr2.length ; i++){
            arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数
        }
        long start = System.currentTimeMillis();    //获取当前系统时间的毫秒数
        dubble(arr2);
        long end = System.currentTimeMillis();
        System.out.println("话费的时间为:"+(end-start)+"ms");

    }
    //冒泡排序
    public static void dubble(int[] arr) {
        boolean flag;   //标识, 标识在排序中数据是否交换过
        int temp;
        for (int i = 0; i < arr.length - 1; i++) {
            flag = false;
            for(int j = 0 ; j < arr.length -1 -i;j++){
                if(arr[j] > arr[j+1]){
                    temp =arr[j];
                    arr[j] = arr[j+1];
                    arr[j+1] = temp;
                    flag = true;
                }
            }
            if(!flag)
                break;
            //System.out.println("第"+(i+1)+"次排序的结果"+ Arrays.toString(arr));
        }
    }
}

测试排序八万个数据的结果:

花费的时间为:10389ms

 

六、选择排序

选择式排序也属于内部排序法,是从欲排序的数据中,按指定的规则选出某一元素,再依规定交换位置后达到排序的目的。

 

基本思想:

 

选择排序(select sorting)也是一种简单的排序方法。它的基本思想是:第一次从arr[0]~arr[n-1]中选取最小值,与arr[0]交换,第二次从arr[1]~arr[n-1]中选取最小值,与arr[1]交换,第三次从arr[2]~arr[n-1]中选取最小值,与arr[2]交换,…,第i次从arr[i-1]~arr[n-1]中选取最小值,与arr[i-1]交换,…, 第n-1次从arr[n-2]~arr[n-1]中选取最小值,与arr[n-2]交换,总共通过n-1次,得到一个按排序码从小到大排列的有序序列。

选择排序思路的分析图:

 

 

代码实现

package sorting;

import java.util.Arrays;

/**
 * @description:    选择排序
 * @auther:田坤
 * @date 2020/10/8 10:24
 **/
public class SelectSorting {
    public static void main(String[] args) {
        int[] arr = {101,34,119,1};
        //select(arr);

        //测试八万个数据的冒泡排序 O(n^2)
        int[] arr2 = new int[80000];
        for(int i = 0 ; i < arr2.length ; i++){
            arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数
        }
        long start = System.currentTimeMillis();    //获取当前系统时间的毫秒数
        select(arr2);
        long end = System.currentTimeMillis();
        System.out.println("话费的时间为:"+(end-start)+"ms");
    }

    //选择排序
    public static void select(int[] arr) {

/*        //使用逐步推导的方式来完成选择排序
        //原始数据 101,34,119,1
        //算法  先简单——》复杂, 可以把一个复杂的算法,拆分成简单的问题——》逐步解决
        //第一轮
        int minIndex = 0;
        int min = arr[0];
        for (int j = 0 + 1 ; j < arr.length ; j++){
            if(arr[j] < min){
                min = arr[j];
                minIndex = j;
            }
        }
        if(minIndex != 0){
            arr[minIndex] = arr[0];
            arr[0] = min;
        }
        System.out.println("第一轮选择排序的数组:"+ Arrays.toString(arr));

        //第二轮
        minIndex = 1;
        min = arr[1];
        for (int j = 1 + 1 ; j < arr.length ; j++){
            if(arr[j] < min){
                min = arr[j];
                minIndex = j;
            }
        }
        if(minIndex != 1){
            arr[minIndex] = arr[1];
            arr[1] = min;
        }
        System.out.println("第二轮选择排序的数组:"+ Arrays.toString(arr));

        //第三轮
        minIndex = 2;
        min = arr[2];
        for (int j = 2 + 1 ; j < arr.length ; j++){
            if(arr[j] < min){
                min = arr[j];
                minIndex = j;
            }
        }
        if(minIndex != 2){
            arr[minIndex] = arr[2];
            arr[2] = min;
        }
        System.out.println("第三轮选择排序的数组:"+ Arrays.toString(arr));*/

        int minIndex;   //最小值的索引
        int min;        //最小值
        for (int i = 0; i < arr.length-1; i++) {
            minIndex = i;
            min = arr[i];
            for (int j = i + 1; j < arr.length; j++) {
                if (arr[j] < min) {
                    min = arr[j];
                    minIndex = j;
                }
            }
            if (minIndex != i) {
                arr[minIndex] = arr[i];
                arr[i] = min;
            }
            //System.out.println("第"+(i+1)+"轮选择排序的数组:" + Arrays.toString(arr));
        }
    }
}

测试排序八万个数据的时间:

花费的时间为:2881ms

 

七、插入排序

插入式排序属于内部排序法,是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的。

插入排序的思想:

插入排序(Insertion Sorting)的基本思想是:把n个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有n-1个元素,排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表。

插入排序的思路图:

 

代码实现:

package sorting;

import java.util.Arrays;

/**
 * @description:    插入排序
 * @auther:田坤
 * @date 2020/10/8 15:06
 **/
public class InsertSorting {
    public static void main(String[] args) {
        int[] arr = {101,34,109,1};
        //insert(arr);

        //测试八万个数据的冒泡排序 O(n^2)
        int[] arr2 = new int[80000];
        for(int i = 0 ; i < arr2.length ; i++){
            arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数
        }
        long start = System.currentTimeMillis();    //获取当前系统时间的毫秒数
        insert(arr2);
        long end = System.currentTimeMillis();
        System.out.println("花费的时间为:"+(end-start)+"ms");
    }

    //插入排序
    public static void insert(int[] arr){

        /*//第一轮
        int indexVal = arr[1];
        int insertIndex = 1-1;  // arr[1] 前面的位置的下标
        //给 indexVal找插入的位置(从本位置向前找)
        // insertIndex >= 0 保证在给 insertVal找位置不会越界
        // indexVal < arr[insertIndex] 表示insertIndex 下标的数 大于 indexVak ,所以得继续向前比较
        while ( insertIndex >= 0 && indexVal < arr[insertIndex]){
            arr[insertIndex+1] = arr[insertIndex];
            insertIndex -- ;
        }
        //当while循环退出时,说明插入的位置找到, insertIndex+1
        arr[insertIndex+1] = indexVal;
        System.out.println("第一轮插入排序:"+ Arrays.toString(arr));

        //第二轮
        indexVal = arr[2];
        insertIndex = 2-1;  // arr[1] 前面的位置的下标
        //给 indexVal找插入的位置(从本位置向前找)
        // insertIndex >= 0 保证在给 insertVal找位置不会越界
        // indexVal < arr[insertIndex] 表示insertIndex 下标的数 大于 indexVak ,所以得继续向前比较
        while ( insertIndex >= 0 && indexVal < arr[insertIndex]){
            arr[insertIndex+1] = arr[insertIndex];
            insertIndex -- ;
        }
        //当while循环退出时,说明插入的位置找到, insertIndex+1
        arr[insertIndex+1] = indexVal;
        System.out.println("第二轮插入排序:"+ Arrays.toString(arr));

        //第三轮
        indexVal = arr[3];
        insertIndex = 3-1;  // arr[1] 前面的位置的下标
        //给 indexVal找插入的位置(从本位置向前找)
        // insertIndex >= 0 保证在给 insertVal找位置不会越界
        // indexVal < arr[insertIndex] 表示insertIndex 下标的数 大于 indexVak ,所以得继续向前比较
        while ( insertIndex >= 0 && indexVal < arr[insertIndex]){
            arr[insertIndex+1] = arr[insertIndex];
            insertIndex -- ;
        }
        //当while循环退出时,说明插入的位置找到, insertIndex+1
        arr[insertIndex+1] = indexVal;
        System.out.println("第三轮插入排序:"+ Arrays.toString(arr));*/


        int indexVal;
        int insertIndex;
        for(int i = 1; i < arr.length ; i++){
            indexVal = arr[i];
            insertIndex = i-1;  // arr[i] 前面的位置的下标
            //给 indexVal找插入的位置(从本位置向前找)
            // insertIndex >= 0 保证在给 insertVal找位置不会越界
            // indexVal < arr[insertIndex] 表示insertIndex 下标的数 大于 indexVak ,所以得继续向前比较
            while ( insertIndex >= 0 && indexVal < arr[insertIndex]){
                arr[insertIndex+1] = arr[insertIndex];
                insertIndex -- ;
            }
            //当while循环退出时,说明插入的位置找到, insertIndex+1
            arr[insertIndex+1] = indexVal;
            //System.out.println("第"+i+"轮插入排序:"+ Arrays.toString(arr));
        }

    }
}

 测试排序八万个数据的时间:

花费的时间为:647ms

 

八、希尔排序

简单插入排序存在的问题

我们看简单的插入排序可能存在的问题.
数组 arr = {2,3,4,5,6,1} 这时需要插入的数 1(最小), 这样的过程是:
{2,3,4,5,6,6}
{2,3,4,5,5,6}
{2,3,4,4,5,6}
{2,3,3,4,5,6}
{2,2,3,4,5,6}
{1,2,3,4,5,6}
结论: 当需要插入的数是较小的数时,后移的次数明显增多,对效率有影响

 

希尔排序是希尔(Donald Shell)于1959年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序

希尔排序法基本思想

希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止

希尔排序法的示意图

 

希尔排序法的应用实例

有一群小牛, 考试成绩分别是 {8,9,1,7,2,3,5,4,6,0} 请从小到大排序. 请分别使用

1)希尔排序时, 对有序序列在插入时采用交换法, 并测试排序速度.

2)希尔排序时, 对有序序列在插入时采用移动法, 并测试排序速度

 

代码实现:

package sorting;

import java.util.Arrays;

/**
 * @description:   //希尔排序
 * @auther:田坤
 * @date 2020/10/8 16:34
 **/
public class ShellSorting {
    public static void main(String[] args) {
        int[] arr = {8,5,3,7,9,0,2,4,1,6};
        //shell(arr);
        //shell2(arr);

        //验证八万个数据交换希尔排序的时间
        int[] arr2 = new int[80000];
        for(int i = 0 ; i < arr2.length ; i++){
            arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数
        }
        long start = System.currentTimeMillis();    //获取当前系统时间的毫秒数
        shell(arr2);
        long end = System.currentTimeMillis();
        System.out.println("交换希尔排序花费的时间为:"+(end-start)+"ms");

        start = System.currentTimeMillis();    //获取当前系统时间的毫秒数
        shell2(arr2);
        end = System.currentTimeMillis();
        System.out.println("移动希尔排序花费的时间为:"+(end-start)+"ms");

    }

    //交换法
    public static void shell(int[] arr){

        int temp;

        /*//第一轮  10/2 = 5组
        for (int i = 5 ; i < arr.length; i++){
             //遍历各组中所有的元素(各5组,每组有俩个元素),步长为 5
            for(int j = i-5 ; j >= 0 ; j -= 5){
                if(arr[j] > arr[j+5]){
                    temp = arr[j];
                    arr[j] = arr[j+5];
                    arr[j+5] = temp;
                }
            }
        }
        System.out.println("第一轮排序后:"+ Arrays.toString(arr));

        //第二轮  5/2 = 2组
        for (int i = 2 ; i < arr.length; i++){
            //遍历各组中所有的元素(各2组,每组有5个元素),步长为 2
            for(int j = i-2 ; j >= 0 ; j -= 2){
                if(arr[j] > arr[j+2]){
                    temp = arr[j];
                    arr[j] = arr[j+2];
                    arr[j+2] = temp;
                }
            }
        }
        System.out.println("第二轮排序后:"+ Arrays.toString(arr));

        //第三轮  2/2 = 1组
        for (int i = 1 ; i < arr.length; i++){
            //遍历各组中所有的元素(各1组,每组有10个元素),步长为 1
            for(int j = i-1 ; j >= 0 ; j -= 1){
                if(arr[j] > arr[j+1]){
                    temp = arr[j];
                    arr[j] = arr[j+1];
                    arr[j+1] = temp;
                }
            }
        }
        System.out.println("第三轮排序后:"+ Arrays.toString(arr));*/
        for(int gap = arr.length/2 ; gap > 0 ; gap /= 2){
            //遍历各组中所有的元素(各gap组,每组有 arr.length/gap 个元素),步长为 gap
            for (int i = gap ; i < arr.length; i++){
                for(int j = i-gap ; j >= 0 ; j -= gap){
                    if(arr[j] > arr[j+gap]){
                        temp = arr[j];
                        arr[j] = arr[j+gap];
                        arr[j+gap] = temp;
                    }
                }
            }
            //System.out.println("第三轮排序后:"+ Arrays.toString(arr));
        }
    }

    //移动法
    public static void shell2(int[] arr){
        int temp,j;
        int count = 0;
        //增量gap,逐步的缩小增量
        for(int gap = arr.length/2 ; gap > 0 ; gap /= 2){
            //从第gap 个元素,逐个对其所在的组进行直接插入排序
            for(int i =gap ; i < arr.length ; i++){
                j = i;
                temp = arr[j];
                if(arr[j] < arr[j-gap]){
                    while (j-gap>= 0 && temp < arr[j-gap]){
                        arr[j] = arr[j-gap];
                        j -= gap;
                    }
                    arr[j] = temp;
                }
            }
            //System.out.println("第"+(++count)+"轮排序后:"+ Arrays.toString(arr));
        }
    }
}

交换法和移动法排序八万个数据所花费的时间:

交换希尔排序花费的时间为:8416ms
移动希尔排序花费的时间为:6ms

 

 

九、快速排序

听韩老师的没听太懂,于是在网上找了个比较容易理解的思路

https://blog.csdn.net/morewindows/article/details/6684558

快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。

 

该方法的基本思想是:

1.先从数列中取出一个数作为基准数。

2.分区过程,将比这个数大的数全放到它的右边,小于或等于它的数全放到它的左边。

3.再对左右区间重复第二步,直到各区间只有一个数。

 

虽然快速排序称为分治法,但分治法这三个字显然无法很好的概括快速排序的全部步骤。因此我的对快速排序作了进一步的说明:挖坑填数+分治法

 

以一个数组作为示例,取区间第一个数为基准数。

0

1

2

3

4

5

6

7

8

9

72

6

57

88

60

42

83

73

48

85

初始时,i = 0;  j = 9;   X = a[i] = 72

由于已经将a[0]中的数保存到X中,可以理解成在数组a[0]上挖了个坑,可以将其它数据填充到这来。

从j开始向前找一个比X小或等于X的数。当j=8,符合条件,将a[8]挖出再填到上一个坑a[0]中。a[0]=a[8]; i++;  这样一个坑a[0]就被搞定了,但又形成了一个新坑a[8],这怎么办了?简单,再找数字来填a[8]这个坑。这次从i开始向后找一个大于X的数,当i=3,符合条件,将a[3]挖出再填到上一个坑中a[8]=a[3]; j--;

 

数组变为:

0

1

2

3

4

5

6

7

8

9

48

6

57

88

60

42

83

73

88

85

 i = 3;   j = 7;   X=72

再重复上面的步骤,先从后向前找,再从前向后找

从j开始向前找,当j=5,符合条件,将a[5]挖出填到上一个坑中,a[3] = a[5]; i++;

从i开始向后找,当i=5时,由于i==j退出。

此时,i = j = 5,而a[5]刚好又是上次挖的坑,因此将X填入a[5]。

 

数组变为:

0

1

2

3

4

5

6

7

8

9

48

6

57

42

60

72

83

73

88

85

可以看出a[5]前面的数字都小于它,a[5]后面的数字都大于它。因此再对a[0…4]和a[6…9]这二个子区间重复上述步骤就可以了。

 

对挖坑填数进行总结

1.i =L; j = R; 将基准数挖出形成第一个坑a[i]。

2.j--由后向前找比它小的数,找到后挖出此数填前一个坑a[i]中。

3.i++由前向后找比它大的数,找到后也挖出此数填到前一个坑a[j]中。

4.再重复执行2,3二步,直到i==j,将基准数填入a[i]中。

 

照着这个总结很容易实现挖坑填数的代码:

int AdjustArray(int s[], int l, int r) //返回调整后基准数的位置
{
	int i = l, j = r;
	int x = s[l]; //s[l]即s[i]就是第一个坑
	while (i < j)
	{
		// 从右向左找小于x的数来填s[i]
		while(i < j && s[j] >= x) 
			j--;  
		if(i < j) 
		{
			s[i] = s[j]; //将s[j]填到s[i]中,s[j]就形成了一个新的坑
			i++;
		}
 
		// 从左向右找大于或等于x的数来填s[j]
		while(i < j && s[i] < x)
			i++;  
		if(i < j) 
		{
			s[j] = s[i]; //将s[i]填到s[j]中,s[i]就形成了一个新的坑
			j--;
		}
	}
	//退出时,i等于j。将x填到这个坑中。
	s[i] = x;
 
	return i;
}

再写分治法的代码:

    void quick_sort1(int s[], int l, int r)
    {
    	if (l < r)
        {
    		int i = AdjustArray(s, l, r);//先成挖坑填数法调整s[]
    		quick_sort1(s, l, i - 1); // 递归调用 
    		quick_sort1(s, i + 1, r);
    	}
    }

这样的代码显然不够简洁,对其组合整理下:

//快速排序
void quick_sort(int s[], int l, int r)
{
    if (l < r)
    {
	//Swap(s[l], s[(l + r) / 2]); //将中间的这个数和第一个数交换 参见注1
        int i = l, j = r, x = s[l];
        while (i < j)
        {
            while(i < j && s[j] >= x) // 从右向左找第一个小于x的数
		j--;  
            if(i < j) 
		s[i++] = s[j];
			
            while(i < j && s[i] < x) // 从左向右找第一个大于等于x的数
		i++;  
            if(i < j) 
		s[j--] = s[i];
        }
        s[i] = x;
        quick_sort(s, l, i - 1); // 递归调用 
        quick_sort(s, i + 1, r);
    }
}

测试八万个数据的排序

快速排序花费的时间为:36ms

 

十、归并排序

归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。

 

归并排序思想示意图1-基本思想

说明:

可以看到这种结构很像一棵完全二叉树,本文的归并排序我们采用递归去实现(也可采用迭代的方式去实现)。分阶段可以理解为就是递归拆分子序列的过程。

 

归并排序思想示意图2-合并相邻有序子序列:

再来看看治阶段,我们需要将两个已经有序的子序列合并成一个有序序列,比如上图中的最后一次合并,要将[4,5,7,8]和[1,2,3,6]两个已经有序的子序列,合并为最终序列[1,2,3,4,5,6,7,8],来看下实现步骤

 

归并排序的应用实例:

给你一个数组, val arr = Array {8,4,5,9,1,3,6,2};, 请使用归并排序完成排序。

package sorting;

import java.util.Arrays;

/**
 * @description: 归并排序
 * @auther:田坤
 * @date 2020/10/8 20:37
 **/
public class MergeSorting {
    public static void main(String[] args) {
        int[] arr = {8,4,5,9,1,3,6,2};
        int[] temp = new int[arr.length];
        mergeSorting(arr,0,arr.length-1,temp);
        System.out.println("排序后的数组:"+ Arrays.toString(arr));

       //测试80000个数据排序花费的时间
        int[] arr2 = new int[80000];
        int[] temp1 = new int[arr2.length];
        for(int i = 0 ; i < arr2.length ; i++){
            arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数
        }
        long start = System.currentTimeMillis();    //获取当前系统时间的毫秒数
        mergeSorting(arr2,0,arr2.length-1,temp1);
        long end = System.currentTimeMillis();
        System.out.println("归并排序花费的时间为:"+(end-start)+"ms");
    }

    public static void mergeSorting(int[] arr, int left, int right, int[] temp) {
        if(left < right){
            int mid = (left + right)/2; //中间索引
            //向左递归进行分解
            mergeSorting(arr,left,mid,temp);
            //向右递归进行分解
            mergeSorting(arr,mid+1,right,temp);
            //合并
            merge(arr,left,right,mid,temp);
        }
    }

    //合并

    /**
     * @param arr 排序的原始数组
     * @param left  左边有序序列的初始索引
     * @param right 右边索引 (右边有序的末位索引)
     * @param mid   中间索引(左边有序序列的未位索引)
     * @param temp  做中转的数组
     */
    public static void merge(int[] arr, int left, int right, int mid, int[] temp) {
        int i = left;   //左边有序序列的初始索引
        int j = mid + 1;    //右边有序序列的初始索引
        int t = 0;      //指向temp数组的当前索引

        //先把左右两边的有序序列按照规则(小到大 || 大到小)加入到temp数组中 直到有一边处理完
        while (i <= mid && j <= right) {
            //如果左边有序序列的当前元素小于右边有序序列的当前元素,则将左边的当前元素加入到temp数组
            if (arr[i] < arr[j]) {
                temp[t++] = arr[i++];
            } else {
                temp[t++] = arr[j++];
            }
        }
        //左边未填充完
        while (i <= mid) {
            temp[t++] = arr[i++];
        }
        //右边未填充完
        while (j <= right) {
            temp[t++] = arr[j++];
        }

        //将temp数组的元素拷贝到arr  注意:并不是每次都拷贝所有
        t = 0;
        int templeft = left;

        //第一次合并: templeft=0  right=1   二: templeft=2 right=3
        //三:     templeft=0  right=3
        //System.out.println("templeft="+templeft + "  right="+right);
        while (templeft <= right)
            arr[templeft++] = temp[t++];

    }
}

测试八万个数据排序:

归并排序花费的时间为:21ms

 

十一、基数排序

基数排序(桶排序)介绍:

1)基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用。

2)基数排序法是属于稳定性的排序,基数排序法的是效率高的稳定性排序法

3)基数排序(Radix Sort)是桶排序的扩展

4)基数排序是1887年赫尔曼·何乐礼发明的。它是这样实现的:将整数按位数切割成不同的数字,然后按每个位数分别比较。

 

基数排序基本思想

将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。

基数排序的图文说明

要求:将数组 {53, 3, 542, 748, 14, 214} 使用基数排序, 进行升序排序。

 

代码实现:

package sorting;

import java.util.Arrays;

/**
 * @description:  基数排序
 * @auther:田坤
 * @date 2020/10/9 6:43
 **/
public class RadixSorting {
    public static void main(String[] args) {
        int[] arr = {53, 3, 542, 748, 14, 214 };
        //radix(arr);

        //验证八万个数据基数排序的时间
        int[] arr2 = new int[80000];
        for(int i = 0 ; i < arr2.length ; i++){
            arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数
        }
        long start = System.currentTimeMillis();    //获取当前系统时间的毫秒数
        radix(arr2);
        long end = System.currentTimeMillis();
        System.out.println("基数排序花费的时间为:"+(end-start)+"ms");

        // 800000000 * 11 * 4 / 1024 / 1024 = 33G
        //验证八亿个数据基数排序的时间
        int[] arr3 = new int[800000000];
        for(int i = 0 ; i < arr2.length ; i++){
            arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数
        }

    }

    //基数排序
    public static void radix(int[] arr){
        //创建一个二维数组来模拟10个桶,每个桶都是一个一位数组
        //为了防止数据越界,每个桶的长度等于排序数组的长度
        //所以基数排序是典型的用空间换时间算法
        int[][] bucket = new int[10][arr.length];

        //定义一个一维数组用来存储每个桶存储数据的个数
        int[] bucketElementCount = new int[10];

        //找出arr中的最大数,求出它是几位数
        int max = arr[0];
        int index;  //回填数据到arr里的索引
        for(int i = 0; i < arr.length ; i++){
            if(arr[i] > max)
                max = arr[i];
        }
        int maxLength = (max+"").length();  //最大数是几位数

        for(int i = 0, n = 1; i < maxLength ; i++,n*=10){
            //针对每个元素所对应位来进行排序处理
            for(int j = 0 ; j < arr.length ; j++){
                //取出每个元素对应位的数
                int unitsDigit = arr[j] /n  % 10;
                //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++
                bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j];
                bucketElementCount[unitsDigit]++;
            }

            index = 0;
            //将桶中的数据依次放入原数组中去
            for(int j = 0 ;j < bucket.length ; j++){
                for(int k = 0 ; k < bucketElementCount[j] ; k++){
                    arr[index++] = bucket[j][k];
                }
                bucketElementCount[j] = 0;
            }
            //System.out.println("第"+(i+1)+"轮排序:"+ Arrays.toString(arr));

        }

        /*//第一轮  放个位数
        for(int j = 0 ; j < arr.length ; j++){
            //个位数
            int unitsDigit = arr[j] / 1 % 10;
            //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++
            bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j];
            bucketElementCount[unitsDigit]++;
        }

        int index = 0;
        //将桶中的数据依次放入原数组中去
        for(int j = 0 ;j < bucket.length ; j++){
            for(int k = 0 ; k < bucketElementCount[j] ; k++){
                arr[index++] = bucket[j][k];
            }
            bucketElementCount[j] = 0;
        }
        System.out.println("第一轮排序:"+ Arrays.toString(arr));


        //第二轮  放十位数
        for(int j = 0 ; j < arr.length ; j++){
            //个位数
            int unitsDigit = arr[j] / 10 % 10;
            //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++
            bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j];
            bucketElementCount[unitsDigit]++;
        }

        index = 0;
        //将桶中的数据依次放入原数组中去
        for(int j = 0 ;j < bucket.length ; j++){
            for(int k = 0 ; k < bucketElementCount[j] ; k++){
                arr[index++] = bucket[j][k];
            }
            bucketElementCount[j] = 0;
        }
        System.out.println("第二轮排序:"+ Arrays.toString(arr));

        //第三轮  放百位数
        for(int j = 0 ; j < arr.length ; j++){
            //个位数
            int unitsDigit = arr[j] / 100 % 10;
            //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++
            bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j];
            bucketElementCount[unitsDigit]++;
        }

        index = 0;
        //将桶中的数据依次放入原数组中去
        for(int j = 0 ;j < bucket.length ; j++){
            for(int k = 0 ; k < bucketElementCount[j] ; k++){
                arr[index++] = bucket[j][k];
            }
            bucketElementCount[j] = 0;
        }
        System.out.println("第三轮排序:"+ Arrays.toString(arr));
*/
    }
}

测试数据排序结果

//测试八万个数据排序:

基数排序花费的时间为:49ms

//测试八亿个数据排序: 内存不够             800000000 * 11 * 4 / 1024 / 1024 = 33G

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
    at sorting.RadixSorting.radix(RadixSorting.java:42)
    at sorting.RadixSorting.main(RadixSorting.java:32)

 

对基数排序数组的一点小改进

因为创建二维数组每个桶的长度因为装不下(越界)所以长度给的都是整个排序数组的长度,那么显然这个会使二维数组(bucket)的占用空间大大增大。所以我在场景二维数组(bucket)他的二维数组行的个数先设置的比较小(排序数据的十分之一),如果数组满了,进行扩容 (扩容后的大小 = 原有的大小 + 原有的大小  / 2)

 

//对二维数组的某一行进行扩容
    public static void dilatation(int[][] arr,int row){
        int[] newArr = new int[arr[row].length + arr[row].length /2];
        //将原来二维数组row行的数据复制给newArr
        for (int i = 0; i < arr[row].length; i++) {
            newArr[i] = arr[row][i];
        }
        arr[row] = newArr;
    }

    //基数排序
    public static void radix(int[] arr){
        //创建一个二维数组来模拟10个桶,每个桶都是一个一位数组
        //为了防止数据越界,每个桶的长度等于排序数组的长度
        //所以基数排序是典型的用空间换时间算法
        int[][] bucket = new int[10][arr.length / 10];

        //定义一个一维数组用来存储每个桶存储数据的个数
        int[] bucketElementCount = new int[10];

        //找出arr中的最大数,求出它是几位数
        int max = arr[0];
        int index;  //回填数据到arr里的索引
        for(int i = 0; i < arr.length ; i++){
            if(arr[i] > max)
                max = arr[i];
        }
        int maxLength = (max+"").length();  //最大数是几位数

        for(int i = 0, n = 1; i < maxLength ; i++,n*=10){
            //针对每个元素所对应位来进行排序处理
            for(int j = 0 ; j < arr.length ; j++){
                //取出每个元素对应位的数
                int unitsDigit = arr[j] /n  % 10;
                //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++
                if(bucket[unitsDigit].length != bucketElementCount[unitsDigit]){
                     bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j];
                }else {
                    //如果我的数组满了,进行扩容
                    dilatation(bucket,unitsDigit);
                }
                bucketElementCount[unitsDigit]++;
            }

            index = 0;
            //将桶中的数据依次放入原数组中去
            for(int j = 0 ;j < bucket.length ; j++){
                for(int k = 0 ; k < bucketElementCount[j] ; k++){
                    arr[index++] = bucket[j][k];
                }
                bucketElementCount[j] = 0;
            }
            //System.out.println("第"+(i+1)+"轮排序:"+ Arrays.toString(arr));

        }

我也不知道该怎么进行合理的测试,我就测试了十几个值所输出的结果:(我电脑16G的内存,)

改进前的基数排序,数据大于100000000就会内存不够。

而我改进后,250000000也是可以进行排序的

 

以下是我测试俩种方法的效率对比:(因为跑一次得十秒我也没多跑,跑了30次) 以下结果为:跑了三十次,每一次对比看谁用的时间多,就单纯结果对比来说,改进后的基数排序比原先的基数排序速度更快,更节省空间

改进前:25
改进后:5

 

 

 

关于基础排序的说明:

1)基数排序是对传统桶排序的扩展,速度很快.

2)基数排序是经典的空间换时间的方式,占用内存很大, 当对海量数据排序时,容易造成 OutOfMemoryError

3)基数排序是稳定的。[注:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的]

4)有负数的数组,我们不用基数排序来进行排序, 如果要支持负数

将数组中的负数整数分开,使它们成为正数,然后使用基数排序为正值,然后反转并附加排序后的非负数组。

 

十二、堆排序

 

十三、常用排序算法的总结和对比

相关术语解释:

1)稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;
2)不稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面;
3)内排序:所有排序操作都在内存中完成;
4)外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;

5)时间复杂度: 一个算法执行所耗费的时间。
6)空间复杂度:运行完一个程序所需内存的大小。
7)n: 数据规模
8)k: “桶”的个数
9)In-place:    不占用额外内存
10)Out-place: 占用额外内存

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值