数据结构与算法(十)排序算法概述、冒泡、快速排序

1、排序算法概述

所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。排序算法,就是如何使得记录按照要求排列的方法。排序算法在很多领域得到相当地重视,尤其是在大量数据的处理方面。

一个排序算法是稳定的,就是当有两个相等记录的关键字R和S,且在原本的列表中R出现在S之前,在排序过的列表中R也将会是在S之前。

如果算法是稳定的有什么好处呢?排序算法如果是稳定的,那么从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。基数排序就是这样,先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。

排序算法根据是否需要访问外存分为内部排序和外部排序。

内部排序是指待排序列完全存放在内存中所进行的排序过程,适合不太大的元素序列。

外部排序指的是大文件的排序,即待排序的记录存储在外存储器上,待排序的文件无法一次装入内存,需要在内存和外部存储器之间进行多次数据交换,以达到排序整个文件的目的。

在这里插入图片描述

2、冒泡排序

冒泡排序的效率很低,但是算法实现起来很简单,因此很适合作为研究排序的入门算法。

2.1 基本思想

对当前还未排好序的范围内的全部数,自上而下对相邻的俩个数依次进行比较和调整,让较大的数下沉,较小的数往上冒。即:每当俩相邻的数比较后发现他们的排序与排序的要求相反时,就将他们交换。每次遍历都可确定一个最大值放到待排数组的末尾,下次遍历,对该最大值以及它之后的元素不再排序(已经排好)。
在这里插入图片描述

2.2 实例

public class Sort {

    private int[] array;

    public Sort(int[] array) {
        this.array = array;
    }

    // 按顺序打印数组中的元素
    public void display() {
        for (int i = 0; i < array.length; i++) {
            System.out.print(array[i] + "\t");
        }
        System.out.println();
    }

    // 冒泡排序
    public void bubbleSort() {
        int temp;
        int len = array.length;

        for (int i = 0; i < len - 1; i++) { // 外层循环:每循环一次就确定了一个相对最大元素
            for (int j = 1; j < len - i; j++) { // 内层循环:有i个元素已经排好,根据i确定本次的比较次数
                if (array[j - 1] > array[j]) { // 如果前一位大于后一位,交换位置
                    temp = array[j - 1];
                    array[j - 1] = array[j];
                    array[j] = temp;
                }
            }
            System.out.print("第" + (i + 1) + "轮排序结果:");
            display();
        }
    }

}

    public static void main(String[] args) {
        int [] a = {1,5,4,11,2,20,18};
        Sort sort = new Sort(a);
        System.out.print("未排序时的结果:");
        sort.display();
        sort.bubbleSort();

    }

在这里插入图片描述

2.3 算法分析

上面的例子中,待排数组中一共有7个数,第一轮排序时进行了6次比较,第二轮排序时进行了5比较,依次类推,最后一轮进行了一次比较。

加入元素总数为N,则一共需要的比较次数为:

(N-1)+ (N-2)+ (N-3)+ …1=N*(N-1)/2

这样,算法约做了N^2/2次比较。因为只有在前面的元素比后面的元素大时才交换数据,所以交换的次数少于比较的次数。如果数据是随机的,大概有一半数据需要交换,则交换的次数为
N^2/4(不过在最坏情况下,即初始数据逆序时,每次比较都需要交换)。

交换和比较的操作次数都与N^2成正比,由于在大O表示法中,常数忽略不计,冒泡排序的时间复杂度为
O(N^2)。

O(N^2)的时间复杂度是一个比较糟糕的结果,尤其在数据量很大的情况下。所以冒泡排序通常不会用于实际应用。

2.4 冒泡排序的改进

上面已经分析过,冒泡排序的效率比较低,所以我们要通过各种方法改进。

最简单的改进方法是加入一标志性变量exchange,用于标志某一趟排序过程中是否有数据交换,如果进行某一趟排序时并没有进行数据交换,则说明数据已经按要求排列好,可立即结束排序,避免不必要的比较过程。

在上例中,第四轮排序之后实际上整个数组已经是有序的了,最后两轮的比较没必要进行。

改进后的代码如下:

    public void bubbleSort_improvement_1() {
        int temp;
        int len = array.length;

        for (int i = 0; i < len - 1; i++) {
            boolean exchange = false; // 设置交换变量
            for (int j = 1; j < len - i; j++) {
                if (array[j - 1] > array[j]) { // 如果前一位大于后一位,交换位置
                    temp = array[j - 1];
                    array[j - 1] = array[j];
                    array[j] = temp;

                    if (!exchange)
                        exchange = true; // 发生了交换操作
                }
            }
            System.out.print("第" + (i + 1) + "轮排序结果:");
            display();
            if (!exchange)
                break; // 如果上一轮没有发生交换数据,证明已经是有序的了,结束排序
        }
    }

在这里插入图片描述
int [] a = {25,6,1,30,5,15,4,11,2,20,0,18};
结果:
在这里插入图片描述
上面的改进方法,是根据上一轮排序有没有发生数据交换作为标识,进一步思考,如果上一轮排序中,只有后一段的几个元素没有发生数据交换,是不是可以判定这一段不用在进行比较了呢?答案是肯定的。

例如上面的例子中,前四轮的排序结果为:

未排序时的结果:1 5 4 11 2 20 18
第1轮排序结果:1 4 5 2 11 18 20
第2轮排序结果:1 4 2 5 11 18 20
第3轮排序结果:1 2 4 5 11 18 20
第4轮排序结果:1 2 4 5 11 18 20
第1轮排序之后,11、18、20已经是有序的了,后面的几次排序后它们的位置都没有变化,但是根据冒泡算法,18依然会在第2轮参与比较,11依然会在第2轮、第3轮参与比较,其实都是无用功。

我们可以对算法进一步改进:设置一个pos指针,pos后面的数据在上一轮排序中没有发生交换,下一轮排序时,就对pos之后的数据不再比较。

代码改动如下:

    public void bubbleSort_improvement_2() {
        int temp;
        int counter = 1;
        int endPoint = array.length - 1; // endPoint代表最后一个需要比较的元素下标

        while (endPoint > 0) {
            int pos = 1;
            for (int j = 1; j <= endPoint; j++) {
                if (array[j - 1] > array[j]) { // 如果前一位大于后一位,交换位置
                    temp = array[j - 1];
                    array[j - 1] = array[j];
                    array[j] = temp;

                    pos = j; // 下标为j的元素与下标为j-1的元素发生了数据交换
                }
            }
            endPoint = pos - 1; // 下一轮排序时只对下标小于pos的元素排序,下标大于等于pos的元素已经排好

            System.out.print("第" + counter++ + "轮排序结果:");
            display();
        }
    }

在这里插入图片描述
int [] a = {25,6,1,30,5,15,4,11,2,20,0,18};
结果:
在这里插入图片描述

传统的冒泡算法每次排序只确定了最大值,我们可以在每次循环之中进行正反两次冒泡,分别找到最大值和最小值,如此可使排序的轮数减少一半。

    public void bubbleSort_improvement_3() {
        int temp;
        int low = 0;
        int high = array.length - 1;
        int counter = 1;
        while (low < high) {

            for (int i = low; i < high; ++i) { // 正向冒泡,确定最大值
                if (array[i] > array[i + 1]) { // 如果前一位大于后一位,交换位置
                    temp = array[i];
                    array[i] = array[i + 1];
                    array[i + 1] = temp;

                }
            }
            System.out.print("counter:"+counter+",正向:");
            display();
            --high;

            for (int j = high; j > low; --j) { // 反向冒泡,确定最小值
                if (array[j] < array[j - 1]) { // 如果前一位大于后一位,交换位置
                    temp = array[j];
                    array[j] = array[j - 1];
                    array[j - 1] = temp;

                }
            }
            System.out.print("counter:"+counter+",反向:");
            display();
            ++low;

            System.out.print("第" + counter + "轮排序结果:");
            display();
            counter++;
        }
    }

在这里插入图片描述

算法来说,没有最好,只有更好,以上仅供参考

3 快速排序

3.1、基本思想

快速排序也是基于分治算法。步骤如下:

选择一个基准元素,通常选择第一个元素或者最后一个元素;
通过一趟排序将待排序的记录分割成独立的两部分,其中一部分记录的元素值均比基准元素值小。另一部分记录的 元素值比基准值大;
此时基准元素在其排好序后的正确位置;
然后分别对这两部分记录用同样的方法继续进行排序,直到整个序列有序。

在这里插入图片描述
上图中,演示的是第一轮快速排序的过程,首先将第一个元素选为基准点,从右端第一个元素开始扫描,找到第一个比57小的元素(19)时停止,两者交换位置,然后从左端开始扫描,找到第一个比57大的元素(68)时停止,两者交换位置,周而复始,直到57找不到可交换的元素为止,至此一轮快速排序结束。

这时,比57小的元素都在左边,比57大的元素都在右边,分别对两边的数组段继续进行快速排序,依次类推,最终使整个数组有序。

3.2实例

    public void quikSort() {
        recursiveQuikSort(0, array.length - 1);
    }

    /**
     * 
     * - 递归的快速排序
     * 
     * - @param low 数组的最小下标 
     * - @param high 数组的最大下标
     */
    private void recursiveQuikSort(int low, int high) {
        if (low >= high) {
            return;
        } else {
            int pivot = array[low]; // 以第一个元素为基准
            int partition = partition(low, high, pivot); 
            // 对数组进行划分,比pivot小的元素在低位段,比pivot大的元素在高位段

            display();

            recursiveQuikSort(low, partition - 1); // 对划分后的低位段进行快速排序
            recursiveQuikSort(partition + 1, high); // 对划分后的高位段进行快速排序
        }
    }

    /**
     * 
     * - 以pivot为基准对下标low到high的数组进行划分
     * 
     * - @param low 数组段的最小下标
     * 
     * - @param high 数组段的最大下标
     * 
     * - @param pivot 划分的基准元素
     * 
     * - @return 划分完成后基准元素所在位置的下标
     */
    private int partition(int low, int high, int pivot) {

        while (low < high) {

            while (low < high && array[high] >= pivot) { 
                // 从右端开始扫描,定位到第一个比pivot小的元素
                high--;
            }
            swap(low, high);

            while (low < high && array[low] <= pivot) { 
                // 从左端开始扫描,定位到第一个比pivot大的元素
                low++;
            }
            swap(low, high);

        }
        return low;

    }

    /**
     * 
     * - 交换数组中两个元素的数据 
     - @param low 欲交换元素的低位下标 
     - @param high 欲交换元素的高位下标
     */
    private void swap(int low, int high) {
        int temp = array[high];
        array[high] = array[low];
        array[low] = temp;
    }

3.3、算法分析

在归并排序中,我们详细推算了时间复杂度,快速排序与归并排序一样采取了分治算法,它的时间复杂度也是O(Nlog2N)。

对于分治算法一般都是如此,用递归的方法把数据项分为两组,然后调用自身来分别处理每一组数据。算法实际上是以2为底,运行时间与N*log2N成正比。

对于快速排序来说,最理想的状态是随机分布的数据,即我们任意选定的枢纽处于中间位置,有一半元素小于它,有一半元素大于它。当数据时由小到大排列或者由大到小排列时,快速排序的效率最低,时间复杂度扩大为O(N2)。

选定第一个元素为枢纽实现起来确实很简单,但是当它为最大值或最小值时,快速排序的效率会严重降低。假如选中的元素为数组的中值,自然是最好的选择,但是却要遍历整个数组来确定中值,这个过程可能比排序花费的时间还长,得不偿失。折衷的方法是找到数组中的第一个、最后一个以及处于中间位置的元素,选出三者的中值作为枢纽,既避免了枢纽是最值的情况,也不会像在全部元素中寻找中值那样费时间。这种方法被称为“三项数据取中”(median-of-three)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值