数据结构与算法（十）排序算法概述、冒泡、快速排序

最新推荐文章于 2021-01-19 16:59:44 发布

Damon_zqt

最新推荐文章于 2021-01-19 16:59:44 发布

阅读量227

点赞数

分类专栏：数据结构与算法

本文链接：https://blog.csdn.net/Damon_zqt/article/details/105835269

版权

数据结构与算法专栏收录该内容

15 篇文章 2 订阅

订阅专栏

1、排序算法概述

所谓排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。排序算法，就是如何使得记录按照要求排列的方法。排序算法在很多领域得到相当地重视，尤其是在大量数据的处理方面。

一个排序算法是稳定的，就是当有两个相等记录的关键字R和S，且在原本的列表中R出现在S之前，在排序过的列表中R也将会是在S之前。

如果算法是稳定的有什么好处呢？排序算法如果是稳定的，那么从一个键上排序，然后再从另一个键上排序，第一个键排序的结果可以为第二个键排序所用。基数排序就是这样，先按低位排序，逐次按高位排序，低位相同的元素其顺序再高位也相同时是不会改变的。

排序算法根据是否需要访问外存分为内部排序和外部排序。

内部排序是指待排序列完全存放在内存中所进行的排序过程，适合不太大的元素序列。

外部排序指的是大文件的排序，即待排序的记录存储在外存储器上，待排序的文件无法一次装入内存，需要在内存和外部存储器之间进行多次数据交换，以达到排序整个文件的目的。

在这里插入图片描述

2、冒泡排序

冒泡排序的效率很低，但是算法实现起来很简单，因此很适合作为研究排序的入门算法。

2.1 基本思想

对当前还未排好序的范围内的全部数，自上而下对相邻的俩个数依次进行比较和调整，让较大的数下沉，较小的数往上冒。即：每当俩相邻的数比较后发现他们的排序与排序的要求相反时，就将他们交换。每次遍历都可确定一个最大值放到待排数组的末尾，下次遍历，对该最大值以及它之后的元素不再排序（已经排好）。
在这里插入图片描述

2.2 实例

public class Sort {

    private int[] array;

    public Sort(int[] array) {
        this.array = array;
    }

    // 按顺序打印数组中的元素
    public void display() {
        for (int i = 0; i < array.length; i++) {
            System.out.print(array[i] + "\t");
        }
        System.out.println();
    }

    // 冒泡排序
    public void bubbleSort() {
        int temp;
        int len = array.length;

        for (int i = 0; i < len - 1; i++) { // 外层循环：每循环一次就确定了一个相对最大元素
            for (int j = 1; j < len - i; j++) { // 内层循环：有i个元素已经排好，根据i确定本次的比较次数
                if (array[j - 1] > array[j]) { // 如果前一位大于后一位，交换位置
                    temp = array[j - 1];
                    array[j - 1] = array[j];
                    array[j] = temp;
                }
            }
            System.out.print("第" + (i + 1) + "轮排序结果：");
            display();
        }
    }

}

    public static void main(String[] args) {
        int [] a = {1,5,4,11,2,20,18};
        Sort sort = new Sort(a);
        System.out.print("未排序时的结果：");
        sort.display();
        sort.bubbleSort();

    }

在这里插入图片描述

2.3 算法分析

上面的例子中，待排数组中一共有7个数，第一轮排序时进行了6次比较，第二轮排序时进行了5比较，依次类推，最后一轮进行了一次比较。

加入元素总数为N，则一共需要的比较次数为：

(N-1)+ (N-2)+ (N-3)+ …1=N*(N-1)/2

这样，算法约做了N^2/2次比较。因为只有在前面的元素比后面的元素大时才交换数据，所以交换的次数少于比较的次数。如果数据是随机的，大概有一半数据需要交换，则交换的次数为
N^2/4（不过在最坏情况下，即初始数据逆序时，每次比较都需要交换）。

交换和比较的操作次数都与N^2成正比，由于在大O表示法中，常数忽略不计，冒泡排序的时间复杂度为
O(N^2)。

O(N^2)的时间复杂度是一个比较糟糕的结果，尤其在数据量很大的情况下。所以冒泡排序通常不会用于实际应用。

2.4 冒泡排序的改进

上面已经分析过，冒泡排序的效率比较低，所以我们要通过各种方法改进。

最简单的改进方法是加入一标志性变量exchange，用于标志某一趟排序过程中是否有数据交换，如果进行某一趟排序时并没有进行数据交换，则说明数据已经按要求排列好，可立即结束排序，避免不必要的比较过程。

在上例中，第四轮排序之后实际上整个数组已经是有序的了，最后两轮的比较没必要进行。

改进后的代码如下：

    public void bubbleSort_improvement_1() {
        int temp;
        int len = array.length;

        for (int i = 0; i < len - 1; i++) {
            boolean exchange = false; // 设置交换变量
            for (int j = 1; j < len - i; j++) {
                if (array[j - 1] > array[j]) { // 如果前一位大于后一位，交换位置
                    temp = array[j - 1];
                    array[j - 1] = array[j];
                    array[j] = temp;

                    if (!exchange)
                        exchange = true; // 发生了交换操作
                }
            }
            System.out.print("第" + (i + 1) + "轮排序结果：");
            display();
            if (!exchange)
                break; // 如果上一轮没有发生交换数据，证明已经是有序的了，结束排序
        }
    }

在这里插入图片描述
int [] a = {25,6,1,30,5,15,4,11,2,20,0,18};
结果：

上面的改进方法，是根据上一轮排序有没有发生数据交换作为标识，进一步思考，如果上一轮排序中，只有后一段的几个元素没有发生数据交换，是不是可以判定这一段不用在进行比较了呢？答案是肯定的。

例如上面的例子中，前四轮的排序结果为：

未排序时的结果：1 5 4 11 2 20 18
第1轮排序结果：1 4 5 2 11 18 20
第2轮排序结果：1 4 2 5 11 18 20
第3轮排序结果：1 2 4 5 11 18 20
第4轮排序结果：1 2 4 5 11 18 20
第1轮排序之后，11、18、20已经是有序的了，后面的几次排序后它们的位置都没有变化，但是根据冒泡算法，18依然会在第2轮参与比较，11依然会在第2轮、第3轮参与比较，其实都是无用功。

我们可以对算法进一步改进：设置一个pos指针，pos后面的数据在上一轮排序中没有发生交换，下一轮排序时，就对pos之后的数据不再比较。

代码改动如下：

    public void bubbleSort_improvement_2() {
        int temp;
        int counter = 1;
        int endPoint = array.length - 1; // endPoint代表最后一个需要比较的元素下标

        while (endPoint > 0) {
            int pos = 1;
            for (int j = 1; j <= endPoint; j++) {
                if (array[j - 1] > array[j]) { // 如果前一位大于后一位，交换位置
                    temp = array[j - 1];
                    array[j - 1] = array[j];
                    array[j] = temp;

                    pos = j; // 下标为j的元素与下标为j-1的元素发生了数据交换
                }
            }
            endPoint = pos - 1; // 下一轮排序时只对下标小于pos的元素排序，下标大于等于pos的元素已经排好

            System.out.print("第" + counter++ + "轮排序结果：");
            display();
        }
    }

在这里插入图片描述
int [] a = {25,6,1,30,5,15,4,11,2,20,0,18};
结果：

传统的冒泡算法每次排序只确定了最大值，我们可以在每次循环之中进行正反两次冒泡，分别找到最大值和最小值，如此可使排序的轮数减少一半。

    public void bubbleSort_improvement_3() {
        int temp;
        int low = 0;
        int high = array.length - 1;
        int counter = 1;
        while (low < high) {

            for (int i = low; i < high; ++i) { // 正向冒泡，确定最大值
                if (array[i] > array[i + 1]) { // 如果前一位大于后一位，交换位置
                    temp = array[i];
                    array[i] = array[i + 1];
                    array[i + 1] = temp;

                }
            }
            System.out.print("counter:"+counter+",正向:");
            display();
            --high;

            for (int j = high; j > low; --j) { // 反向冒泡，确定最小值
                if (array[j] < array[j - 1]) { // 如果前一位大于后一位，交换位置
                    temp = array[j];
                    array[j] = array[j - 1];
                    array[j - 1] = temp;

                }
            }
            System.out.print("counter:"+counter+",反向:");
            display();
            ++low;

            System.out.print("第" + counter + "轮排序结果：");
            display();
            counter++;
        }
    }

在这里插入图片描述

算法来说，没有最好，只有更好，以上仅供参考

3 快速排序

3.1、基本思想

快速排序也是基于分治算法。步骤如下：

选择一个基准元素，通常选择第一个元素或者最后一个元素；
通过一趟排序将待排序的记录分割成独立的两部分，其中一部分记录的元素值均比基准元素值小。另一部分记录的元素值比基准值大；
此时基准元素在其排好序后的正确位置；
然后分别对这两部分记录用同样的方法继续进行排序，直到整个序列有序。

在这里插入图片描述
上图中，演示的是第一轮快速排序的过程，首先将第一个元素选为基准点，从右端第一个元素开始扫描，找到第一个比57小的元素（19）时停止，两者交换位置，然后从左端开始扫描，找到第一个比57大的元素（68）时停止，两者交换位置，周而复始，直到57找不到可交换的元素为止，至此一轮快速排序结束。

这时，比57小的元素都在左边，比57大的元素都在右边，分别对两边的数组段继续进行快速排序，依次类推，最终使整个数组有序。

3.2实例

    public void quikSort() {
        recursiveQuikSort(0, array.length - 1);
    }

    /**
     * 
     * - 递归的快速排序
     * 
     * - @param low 数组的最小下标 
     * - @param high 数组的最大下标
     */
    private void recursiveQuikSort(int low, int high) {
        if (low >= high) {
            return;
        } else {
            int pivot = array[low]; // 以第一个元素为基准
            int partition = partition(low, high, pivot); 
            // 对数组进行划分，比pivot小的元素在低位段，比pivot大的元素在高位段

            display();

            recursiveQuikSort(low, partition - 1); // 对划分后的低位段进行快速排序
            recursiveQuikSort(partition + 1, high); // 对划分后的高位段进行快速排序
        }
    }

    /**
     * 
     * - 以pivot为基准对下标low到high的数组进行划分
     * 
     * - @param low 数组段的最小下标
     * 
     * - @param high 数组段的最大下标
     * 
     * - @param pivot 划分的基准元素
     * 
     * - @return 划分完成后基准元素所在位置的下标
     */
    private int partition(int low, int high, int pivot) {

        while (low < high) {

            while (low < high && array[high] >= pivot) { 
                // 从右端开始扫描，定位到第一个比pivot小的元素
                high--;
            }
            swap(low, high);

            while (low < high && array[low] <= pivot) { 
                // 从左端开始扫描，定位到第一个比pivot大的元素
                low++;
            }
            swap(low, high);

        }
        return low;

    }

    /**
     * 
     * - 交换数组中两个元素的数据 
     - @param low 欲交换元素的低位下标 
     - @param high 欲交换元素的高位下标
     */
    private void swap(int low, int high) {
        int temp = array[high];
        array[high] = array[low];
        array[low] = temp;
    }

3.3、算法分析

在归并排序中，我们详细推算了时间复杂度，快速排序与归并排序一样采取了分治算法，它的时间复杂度也是O(Nlog2N)。

对于分治算法一般都是如此，用递归的方法把数据项分为两组，然后调用自身来分别处理每一组数据。算法实际上是以2为底，运行时间与N*log2N成正比。

对于快速排序来说，最理想的状态是随机分布的数据，即我们任意选定的枢纽处于中间位置，有一半元素小于它，有一半元素大于它。当数据时由小到大排列或者由大到小排列时，快速排序的效率最低，时间复杂度扩大为O(N2)。

选定第一个元素为枢纽实现起来确实很简单，但是当它为最大值或最小值时，快速排序的效率会严重降低。假如选中的元素为数组的中值，自然是最好的选择，但是却要遍历整个数组来确定中值，这个过程可能比排序花费的时间还长，得不偿失。折衷的方法是找到数组中的第一个、最后一个以及处于中间位置的元素，选出三者的中值作为枢纽，既避免了枢纽是最值的情况，也不会像在全部元素中寻找中值那样费时间。这种方法被称为“三项数据取中”(median-of-three)。