高级排序(希尔、归并、快排、堆排)

高级排序(希尔、归并、快排、堆排)

本文内容:

一、希尔排序
二、归并排序
    1. 最初版本
    2. 优化
三、快速排序
    1. 最初版本
    2. 优化
    3. 二路快排
    4. 三路快排
四、堆排序
五、实验对比
排序算法时间复杂度(一般情况下)最坏情况下最好情况下空间复杂度稳定性
希尔排序O(nlogn)O(n^2)O(n)O(1)不稳定
归并排序O(nlogn)O(nlogn)O(nlogn)O(n)稳定
快速排序O(nlogn)O(n^2)O(nlogn)O(nlogn)不稳定
堆排序O(nlogn)O(nlogn)O(nlogn)O(1)不稳定

一、希尔排序

希尔排序概况:

时间复杂度:
    一般情况下 O(nlogn)
    最好情况下 O(n)
    最坏情况下 O(n^2)
空间复杂度:
    O(1)
稳定性:
    不稳定

思路就是按 gap 增量分区,即 [1, 1 + gap, 1 + 2 * gap, ... , 1 + n * gap] 为一个区,在区内进行插入排序。而 gap 从一开始 gap = arr.length / 2 不停递减,直到 gap = 1

实现如下:

public static void sort(Comparable[] arr) {

    for (int gap = arr.length / 2; gap > 0; gap /= 2) {

        for (int i = gap; i < arr.length; ++i) {
            // 插入排序
            Comparable e = arr[i];
            int j = i - gap;
            for (; j >= 0 && e.compareTo(arr[j]) < 0; j -= gap) {
                arr[j + gap] = arr[j];
            }
            arr[j + gap] = e;
        }

    }
}

二、归并排序

归并排序概况:

时间复杂度:
    一般情况下 O(nlogn)
    最好情况下 O(nlogn)
    最坏情况下 O(nlogn)
空间复杂度:
    O(n)
稳定性:
    稳定

1. 最初版本

分治,一直分到只剩下一个,再进行两两归并。

public static void sort(Comparable[] arr) {
    sort(arr, 0, arr.length - 1);
}

public static void sort(Comparable[] arr, int left, int right) {

    if (left >= right) {
        return;
    }

    int mid = left + (right - left) / 2;

    sort(arr, left, mid);
    sort(arr, mid + 1, right);
    merge(arr, left, mid, right);
}

public static void merge(Comparable[] arr, int left, int mid, int right) {
    Comparable[] backup = Arrays.copyOfRange(arr, left, right + 1);

    int i = left, j = mid + 1;
    for (int k = left; k <= right; ++k) {
        if (i > mid) {
            arr[k] = backup[j - left];
            j++;
        }
        else if (j > right) {
            arr[k] = backup[i - left];
            i++;
        }
        else if (backup[i - left].compareTo(backup[j - left]) <= 0) {
            arr[k] = backup[i - left];
            i++;
        }
        else {
            arr[k] = backup[j - left];
            j++;
        }
    }
}

2. 优化

优化:

  • 规模较小时采用插入排序
  • 验证,当左区间的最大值小于右区间最小值时省略 Merge 计算
  • 辅助空间统一申请,不再是递归过程中各自申请
public static void sort(Comparable[] arr) {
    Comparable[] assistant = new Comparable[arr.length];
    sort(arr, 0, arr.length - 1, assistant);
}

public static void sort(Comparable[] arr, int left, int right, Comparable[] assistant) {
    if (right - left <= 15) {
        // 规模较小插入排序
        InsertionSort(arr, left, right);
        return;
    }

    int mid = left + (right - left) / 2;

    sort(arr, left, mid, assistant);
    sort(arr, mid + 1, right, assistant);

    if (arr[mid].compareTo(arr[mid + 1]) >= 0) {
        merge(arr, left, mid, right, assistant);
    }
}

public static void merge(Comparable[] arr, int left, int mid, int right, Comparable[] assistant) {
    System.arraycopy(arr, left, assistant, left, right - left + 1);

    int i = left, j = mid + 1;
    for (int k = i; k <= right; ++k) {
        if (i > mid) {
            arr[k] = assistant[j++];
        }
        else if (j > right) {
            arr[k] = assistant[i++];
        }
        else if (assistant[i].compareTo(assistant[j]) <= 0) {
            arr[k] = assistant[i++];
        }
        else {
            arr[k] = assistant[j++];
        }
    }
}

三、 快速排序

快速排序概况:

时间复杂度:
    一般情况下 O(nlogn)
    最好情况下 O(nlogn)
    最坏情况下 O(n^2)
空间复杂度:
    O(nlogn)
稳定性:
    不稳定

1. 最初版本

选取第一个作为参照,将比其小的元素往其左边移动,比其大的往右边移动。

public static void sort(Comparable[] arr) {
    sort(arr, 0, arr.length - 1);
}

public static void sort(Comparable[] arr, int left, int right) {
    if (left >= right) {
        return;
    }

    int p = partition(arr, left, right);
    sort(arr, left, p - 1);
    sort(arr, p + 1, right);
}

public static int partition(Comparable[] arr, int left, int right) {
    Comparable e = arr[left];
    int p = left;
    for (int k = left + 1; k <= right; ++k) {
        if (arr[k].compareTo(e) < 0) {
            p++;
            swap(arr, k, p);
        }
    }
    swap(arr, left, p);
    return p;
}

2. 优化

总是采用第一个作为参照使得快排十分不稳定,为了尽可能让快排的结果左右两边的元素个数尽可能平衡,优化如下:

  • 规模较小时,同样采用插入排序
  • 采用随机参照,而不是第一个
public static void sort(Comparable[] arr) {
    sort(arr, 0, arr.length - 1);
}

public static void sort(Comparable[] arr, int left, int right) {
    if (right - left <= 15) {
        // 插入排序
        MergeSort2.InsertionSort(arr, left, right);
        return;
    }

    int p = partition(arr, left, right);
    sort(arr, left, p - 1);
    sort(arr, p + 1, right);
}

public static int partition(Comparable[] arr, int left, int right) {
    swap(arr, left, (int)Math.random() * (right - left + 1) + left);
    Comparable e = arr[left];

    int p = left;
    for (int k = left + 1; k <= right; ++k) {
        if (arr[k].compareTo(e) < 0) {
            p++;
            swap(arr, k, p);
        }
    }
    swap(arr, left, p);
    return p;
}

3. 二路快排

虽然随机标定的优化使得快排更加稳定,但是,当数组存在大量的相等时,以上的方法使得,右区间比左区间要长得多(等于参照的元素都排到了右区间)。针对这种情况,继续优化:

  • 不再是将区间分成 arr[左边] < 参照 <= arr[右边] 的形式,而是改成 arr[左边] <= 参照 <= arr[右边],将部分等于参照的放置在左区间,使得两边更趋平衡。
public static void sort(Comparable[] arr) {
    sort(arr, 0, arr.length - 1);
}

public static void sort(Comparable[] arr, int left, int right) {
    if (right - left <= 15) {
        MergeSort2.InsertionSort(arr, left, right);
        return;
    }

    int p = partition(arr, left, right);
    sort(arr, left, p - 1);
    sort(arr, p + 1, right);
}

public static int partition(Comparable[] arr, int left, int right) {
    swap(arr, left, (int)Math.random() * (right - left + 1) + left);
    Comparable e = arr[left];

    int i = left + 1, j = right;
    while (true) {
        /**
        * 这里采用 e.compareTo(arr[i]) > 0 和 e.compareTo(arr[j]) < 0 判定,
        * 而不采用 e.compareTo(arr[i]) >= 0 和 e.compareTo(arr[j]) <= 0 判定,
        * 当中间都是等于 参照e 时,虽然这么做,增加了 swap 的次数,但是,使得参照两边的区间更加平衡。
        */
        while (i <= right && e.compareTo(arr[i]) > 0) {
            ++i;
        }
        while (j >= left && e.compareTo(arr[j]) < 0) {
            --j;
        }
        if (i > j) {
            break;
        }

        swap(arr, i, j);
        i++;
        j--;
    }
    swap(arr, left, j);
    return j;
}

4. 三路快排

优化:

  • 相较于二路快排,三路快排加入了 arr[i] == e 的考虑,分治排序时,这部分就不用考虑。
 public static void sort(Comparable[] arr) {
     sort(arr, 0, arr.length - 1);
 }

public static void sort(Comparable[] arr, int left, int right) {
    if (right - left <= 15) {
        MergeSort2.InsertionSort(arr, left, right);
        return;
    }

    swap(arr, left, (int)Math.random() * (right - left + 1) + left);
    Comparable e = arr[left];

    // less 标定小于参照的最后一个元素
    int less = left;
    // greater 标定大于参照的第一个元素
    int greater = right + 1;

    int i = left + 1;
    while (i < greater) {
        if (arr[i].compareTo(e) == 0) {
            ++i;
        }
        else if (arr[i].compareTo(e) > 0) {
            swap(arr, i, --greater);
        }
        else {
            /**
                 * 这里与上面不同,这里可 i++,因为与前面对换,而换过来的值等于 e
                 * 而上面 swap(arr, i, greater--); 不可 i++,因为后面换过来的元素还没验证过
                 */
            swap(arr, i++, ++less);
        }
    }
    swap(arr, left, less);

    sort(arr, left, less - 1);
    sort(arr, greater, right);
}

四、堆排序

堆排序概况:

时间复杂度:
    一般情况下 O(nlogn)
    最好情况下 O(nlogn)
    最坏情况下 O(nlogn)
空间复杂度:
    O(1)
稳定性:
    不稳定
static class MinHeap<Item extends Comparable> {
    Item[] items;
    int capacity;
    int size;

    public MinHeap(int capacity) {
        this.items = (Item[]) new Comparable[capacity + 1];
        this.capacity = capacity + 1;
        this.size = 0;
    }

    // Heapify
    public MinHeap(Item[] arr) {
        this.items = (Item[]) new Comparable[arr.length + 1];
        this.capacity = arr.length + 1;

        for (int i = 0; i < arr.length; ++i) {
            items[i] = arr[i];
        }
        this.size = arr.length;

        for (int i = size / 2; i >= 1; --i) {
            shiftDown(i);
        }
    }

    public void insert(Item item) {
        assert size + 1 < capacity;

        items[++size] = item;
        shiftUp(size);
    }

    public Item extractMin() {
        assert size > 0;

        Item res = items[1];
        swap(1, size--);
        shiftDown(1);

        return res;
    }

    private void swap(int i, int j) {
        Item tmp = items[i];
        items[i] = items[j];
        items[j] = tmp;
    }

    private void shiftUp(int i) {
        assert i + 1 >= 1 && i + 1 <= capacity;

        Item e = items[i];
        while (i > 1 && items[i / 2].compareTo(e) > 0) {
            items[i] = items[i / 2];
            i /= 2;
        }
        items[i] = e;
    }

    private void shiftDown(int i) {
        assert i + 1 >= 1 && i + 1 <= capacity;

        Item e = items[i];
        while (i * 2 <= size) {
            int j = i * 2;
            if (j + 1 <= size && items[j + 1].compareTo(items[j]) < 0) {
                j += 1;
            }

            if (items[j].compareTo(e) >= 0) {
                break;
            }

            items[i] = items[j];
            i = j;
        }

        items[i] = e;
    }
}

五、实验对比

经过 100 组大小为 1000000 的数据测试,结果如下:
ShellSort 平均时间 = 857 ms
MergeSort 平均时间 = 322 ms
MergeSort2 平均时间 = 261 ms
MergeSort3 平均时间 = 225 ms
QuickSort 平均时间 = 208 ms
QuickSort2 平均时间 = 197 ms
QuickSort2Ways 平均时间 = 196 ms
QuickSort3Ways 平均时间 = 330 ms
HeapSort 平均时间 = 497 ms
HeapSort2 平均时间 = 497 ms
HeapSort3 平均时间 = 477 ms
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 希尔排序是一种基于插入排序排序算法,它通过将待排序序列分成多个子序列,对子序列进行插入排序,最后整体进行一次插入排序,以此来减少插入排序的比较次数和移动次数。具体实现步骤如下: 1.选择增量序列,一般采用希尔增量序列,即将n/2、n/4……直到h=1。 2.按增量序列将待排序序列分割成若干个子序列。 3.对各个子序列进行插入排序。 4.重复2、3步骤,直到增量为1,即最后进行一次插入排序。 快速排序是一种基于比较的排序算法,它通过选取一个基准元素,将比基准小的元素放在左边,比基准大的元素放在右边,然后分别对左右两个子序列进行递归排序,最终得到有序序列。具体实现步骤如下: 1.选择一个基准元素,一般选择第一个元素。 2.将小于等于基准的元素放在左边,大于等于基准的元素放在右边。 3.对左右两个子序列进行递归排序堆排序是一种基于选择的排序算法,它通过建立最大堆(或最小堆)来进行排序,最大堆的堆顶元素是序列中最大的元素,将其与序列的最后一个元素交换,然后对剩余的n-1个元素进行堆调整,重复此过程直到整个序列有序。具体实现步骤如下: 1.将待排序序列建立为一个最大堆。 2.将堆顶元素与序列的最后一个元素交换。 3.对剩余的n-1个元素进行堆调整。 4.重复2、3步骤,直到整个序列有序。 归并排序是一种基于分治思想的排序算法,它通过将待排序序列递归地分成两个子序列,然后将两个有序的子序列合并成一个有序序列,最终得到有序序列。具体实现步骤如下: 1.将待排序序列分成两个子序列。 2.对左右两个子序列分别进行递归排序。 3.将两个有序的子序列合并成一个有序序列。 以上就是希尔排序、快速排序堆排序、归并排序算法的实现步骤。通过这些排序算法可以对待排序序列进行有序排列,不同算法的时间复杂度和空间复杂度有所不同,具体应根据具体情况选择适合的算法。 ### 回答2: 希尔排序算法: 希尔排序是插入排序的改进版,它通过将序列进行分组,分别对每个分组进行插入排序,再逐步减小分组的规模,最终将整个序列进行插入排序。 快速排序算法: 快速排序使用分治法来对序列进行排序。它选择一个基准元素,将比该元素小的元素移到基准元素左边,比它大的元素移到右边。然后递归地对左右子序列进行同样的操作。 堆排序算法: 堆排序使用堆的数据结构来进行排序。首先构建一个大顶堆(或小顶堆),将堆顶元素与最后一个元素交换,并重新调整堆,然后再将堆顶元素与倒数第二个元素交换,如此重复,直到整个序列有序。 归并排序算法: 归并排序使用分治法,将待排序序列递归地拆分为两个子序列,再将两个子序列合并。合并时,比较两个子序列的元素,将较小(或较大)的元素放入临时数组,直到两个子序列中的元素全部放入临时数组,最后将临时数组的元素复制回原序列。 这四种排序算法在具体实现中可以根据不同情况进行优化,以提高排序效率。 ### 回答3: 希尔排序算法: 希尔排序是一种改进的插入排序算法。它通过将整个数组分割成若干个较小的子序列来改进插入排序,从而实现更快的排序。 快速排序算法: 快速排序是一种经典的排序算法,基于“分而治之”的思想。它通过选择一个基准元素,将数组划分为两个子序列,左边的子序列小于等于基准元素,右边的子序列大于等于基准元素,然后对两个子序列递归进行快速排序,最终得到有序数组。 堆排序算法: 堆排序是一种基于堆结构的排序算法。它首先将待排序的数组构建成一个大顶堆,然后将堆顶元素与最后一个元素交换,并重新调整堆,将次大元素放到堆顶,然后重复这个过程,直到整个数组有序。 归并排序算法: 归并排序是一种分治算法,它将待排序的数组递归地细分为两个子数组,直到子数组的长度为1或0,然后通过将两个有序子数组合并成一个有序数组的操作,最终得到整个数组有序。 总结: 希尔排序通过改进插入排序实现了更快的排序,快速排序通过选择基准元素和递归排序实现了高效的排序堆排序通过构建大顶堆实现了排序归并排序通过分治和合并操作实现了排序。这些算法都是常用的排序算法,它们各自有不同的思想和实现方法,可以根据实际情况选择合适的算法来排序一个数组。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值