排序算法种类
基于比较
选择排序、冒泡排序、插入排序(希尔排序)
归并排序、快排、堆排序
非比较
基数排序、计数排序
算法对比总结
时间复杂度 | 空间复杂度 | 稳定性 | 备注 | |
选择 | O(N^2) | O(1) | ❌ | |
冒泡 | O(N^2) | O(1) | ✅ | |
插入 | O(N^2) | O(1) | ✅ | 常数项小 |
归并 | O(NLogN) | O(N) | ✅ | 内部缓存法(会不稳定) |
快排 | O(NLogN) | O(logN) | ❌ | NLogN复杂度下最快、 stable sort(增加空间复杂度) |
堆排 | O(NLogN) | O(1) | ❌ | topk |
时间复杂度O(N*logN)、额外空间复杂度低于O(N)、且稳定的基于比较的排序是不存在的
为了绝对的速度选快排(时间复杂度的常数时间小)、为了省空间选堆排、为了稳定性选归并
工程上排序算法的选择应用
java Arrays.sort()
Object[] -> TimSort
TimSort
简介
源自归并排序(merge sort)和插入排序(insertion sort)的混合稳定排序算法
“Optimistic Sorting and Information Theoretic Complexity”, in Proceedings of the Fourth Annual ACM-SIAM Symposium on Discrete Algorithms, pp. 467–474, January 1993.
Timsort 已是是 Python、 Java、 Android平台 和 GNU Octave 的默认排序算法
效果
最好 | 平均 | 最坏 | |
快排Quicksort | O(nlog(n)) | O(nlog(n)) | O(n^2) |
归并排序Mergesort | O(nlog(n)) | O(nlog(n)) | O(nlog(n)) |
Timsort | O(n) | O(nlog(n)) | O(nlog(n)) |
实现原理
利用局部有序的特征
1.先采用插入排序将非常小的 run 扩充为较大的 run。minrun(分界线)
2.然后再采用归并排序来合并多个 run,所以说 Timsort 实际为归并排序。
具体实现
minrun选取
[N/minrun] 2的整数次幂或比某个2的整数次幂稍小一点的数
扩充
从头开始找最大的严格单调区间(翻转)、其余元素再使用插入排序
合并
minrun=4
细节优化点
1.minrun 阈值java 32,python 64
2.选择数组长度的六个最高标志位,如果其余的标志位被设置,则加1:
- 189:10111101,取前六个最高标志位为101111(47),同时最后两位为01,所以 minrun 为47+1
- 976:11 1101 0000,取前六个最高标志位为111101(61),同时最后几位为0000,所以 minrun 为61,
3.Timsort 合并2个相邻的 run 需要临时存储空闲,临时存储空间的大小是2个 run 中较小的 run 的大小。Timsort算法先将较小的 run 复制到这个临时存储空间,然后用原先存储这2个 run 的空间来存储合并后的 run。
4.二分插入排序(binary merge sort)。即先用二分查找(binary search)找到插入的位置,然后再插入
5.merge优化 Galloping模式
{1, 2, 3, 9, 10} {4, 5, 6, 7, 8} 聚集的
{1, 3, 5, 7, 9} {2, 4, 6, 8, 10} 均匀的
Dual Pivot Quicksort(双轴快速排序)
int[] ->
一般的快速排序步骤如下:
- 从要排序的列表中选择一个元素,称作轴 pivot。
- 整理列表,使得轴左侧的元素均小于pivot,轴右侧的元素均大于pivot。(其中等于的放在左右侧均可)这个过程称为partition,结束后轴元素便确定了其最终的位置。
- 递归的使用1、2的步骤来排序轴左侧和右侧的两个子序列。
双轴
JDK 1.8 DualPivotQuicksort源码分析
JDK针对七种数据类型实现了七个方法
char类型-> 计数排序
- 长度小于QUICKSORT_THRESHOLD(286),使用快排。
- 判断run个数,当run个数满足大于MAX_RUN_COUNT(67)时,或相同的相连元素个数大于MAX_RUN_LENGTH(33)时,使用快排。(说明数据分布偏随机化,或相等的相连元素比较多。)
- 根据2中已经分好的run,使用归并排序。
快排判断
- 长度n小于INSERTION_SORT_THRESHOLD(47),走插入排序。
- 取 m = n / 7,找到序列中间数e3,向左偏移和向右偏移m个分别两次,也就是一共取五个位置数e1,e2,e3,e4,e5。使用插入排序将这五个位置数排序。
- 如果2中五个数排序后相邻的两两不相同,则取a[e2]和a[e4]作为P1和P2,走双轴快排。否则取pivot = a[e3],走普通的快排。