基础排序算法与Java Arrays.sort()算法

排序算法种类

基于比较

选择排序、冒泡排序、插入排序(希尔排序)

归并排序、快排、堆排序

非比较

基数排序、计数排序

算法对比总结

时间复杂度

空间复杂度

稳定性

备注

选择

O(N^2)

O(1)

冒泡

O(N^2)

O(1)

插入

O(N^2)

O(1)

常数项小

归并

O(NLogN)

O(N)

内部缓存法(会不稳定)

快排

O(NLogN)

O(logN)

NLogN复杂度下最快、

stable sort(增加空间复杂度)

堆排

O(NLogN)

O(1)

topk

时间复杂度O(N*logN)、额外空间复杂度低于O(N)、且稳定的基于比较的排序是不存在的

为了绝对的速度选快排(时间复杂度的常数时间小)、为了省空间选堆排、为了稳定性选归并

工程上排序算法的选择应用

java Arrays.sort()

Object[] -> TimSort

TimSort

简介

源自归并排序(merge sort)和插入排序(insertion sort)的混合稳定排序算法

“Optimistic Sorting and Information Theoretic Complexity”, in Proceedings of the Fourth Annual ACM-SIAM Symposium on Discrete Algorithms, pp. 467–474, January 1993.

Timsort 已是是 Python、 Java、  Android平台 和 GNU Octave 的默认排序算法

效果

最好

平均

最坏

快排Quicksort

O(nlog(n))

O(nlog(n))

O(n^2)

归并排序Mergesort

O(nlog(n))

O(nlog(n))

O(nlog(n))

Timsort

O(n)

O(nlog(n))

O(nlog(n))

实现原理

利用局部有序的特征

1.先采用插入排序将非常小的 run 扩充为较大的 run。minrun(分界线)

2.然后再采用归并排序来合并多个 run,所以说 Timsort 实际为归并排序。

具体实现

minrun选取

[N/minrun] 2的整数次幂或比某个2的整数次幂稍小一点的数

扩充

从头开始找最大的严格单调区间(翻转)、其余元素再使用插入排序

合并

minrun=4

细节优化点

1.minrun 阈值java 32,python 64

2.选择数组长度的六个最高标志位,如果其余的标志位被设置,则加1:

  1. 189:10111101,取前六个最高标志位为101111(47),同时最后两位为01,所以 minrun 为47+1
  2. 976:11 1101 0000,取前六个最高标志位为111101(61),同时最后几位为0000,所以 minrun 为61,

3.Timsort 合并2个相邻的 run 需要临时存储空闲,临时存储空间的大小是2个 run 中较小的 run 的大小。Timsort算法先将较小的 run 复制到这个临时存储空间,然后用原先存储这2个 run 的空间来存储合并后的 run。

4.二分插入排序(binary merge sort)。即先用二分查找(binary search)找到插入的位置,然后再插入

5.merge优化 Galloping模式

{1, 2, 3, 9, 10} {4, 5, 6, 7, 8} 聚集的

{1, 3, 5, 7, 9} {2, 4, 6, 8, 10} 均匀的

Dual Pivot Quicksort(双轴快速排序)

int[] ->

一般的快速排序步骤如下:

  1. 从要排序的列表中选择一个元素,称作轴 pivot。
  2. 整理列表,使得轴左侧的元素均小于pivot,轴右侧的元素均大于pivot。(其中等于的放在左右侧均可)这个过程称为partition,结束后轴元素便确定了其最终的位置。
  3. 递归的使用1、2的步骤来排序轴左侧和右侧的两个子序列。

双轴

JDK 1.8 DualPivotQuicksort源码分析

JDK针对七种数据类型实现了七个方法

char类型-> 计数排序

  1. 长度小于QUICKSORT_THRESHOLD(286),使用快排。
  2. 判断run个数,当run个数满足大于MAX_RUN_COUNT(67)时,或相同的相连元素个数大于MAX_RUN_LENGTH(33)时,使用快排。(说明数据分布偏随机化,或相等的相连元素比较多。)
  3. 根据2中已经分好的run,使用归并排序。

快排判断

  1. 长度n小于INSERTION_SORT_THRESHOLD(47),走插入排序。
  2. 取 m = n / 7,找到序列中间数e3,向左偏移和向右偏移m个分别两次,也就是一共取五个位置数e1,e2,e3,e4,e5。使用插入排序将这五个位置数排序。
  3. 如果2中五个数排序后相邻的两两不相同,则取a[e2]和a[e4]作为P1和P2,走双轴快排。否则取pivot = a[e3],走普通的快排。

参考资料

  1. Timsort — the fastest sorting algorithm you’ve never heard of
  2. https://codeblab.com/wp-content/uploads/2009/09/DualPivotQuicksort.pdf
  • 19
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值