背景
之前一直没关注过Java底层排序的算法,才仔细看了下Timsort。
Timsort 是一个混合、稳定的排序算法,简单来说就是归并排序和二分插入排序算法的混合体,号称世界上最好的排序算法。
它由 Tim Peters 在 2002 年提出并实现,一直是 Python 的标准排序算法。Java 在 1.7 后增加了 Timsort API ,从Java中的 Arrays.sort
可以看出它是默认的排序算法,主要用于非原始类型数组排序。所以不管是进阶编程还是面试,理解 Timsort 都是比较重要。
// List sort()
default void sort(Comparator<? super E> c) {
Object[] a = this.toArray();
//数组排序
Arrays.sort(a, (Comparator) c);
...
}
// Arrays.sort
public static <T> void sort(T[] a, Comparator<? super T> c) {
if (c == null) {
sort(a);
} else {
// 废弃版本
if (LegacyMergeSort.userRequested)
legacyMergeSort(a, c);
else
TimSort.sort(a, 0, a.length, c, null, 0, 0);
}
}
public static void sort(Object[] a) {
if (LegacyMergeSort.userRequested)
legacyMergeSort(a);
else
ComparableTimSort.sort(a, 0, a.length, null, 0, 0);
}
前置知识
理解 Timsort 需要先回顾下面的知识。
指数搜索
指数搜索,也被称为加倍搜索,是一种用于在大型数组中搜索元素而创建的算法。它是一个两步走的过程。首先,该算法试图找到目标元素存在的范围 (L,R)
,然后在这个范围内使用二叉搜索来寻找目标的准确位置。时间复杂度为 O(lgn)O(\lg n)O(lgn)。该搜索算法在大量有序数组中比较有效。
二分插入排序
插入排序算法很简单,大体过程是从第二个元素开始,依次向前移动交换元素直到找到合适的位置。
插入排序最优时间复杂度也要 O(n)O(n)O(n) ,我们可以使用二分查找来减少插入时元素的比较次数,将时间复杂度降为 logn\log nlogn。但是注意,二分查找插入排序仍然需要移动相同数量的元素,但是复制数组的时间消耗低于逐一互换操作。
特点:二分插入排序主要优点是在小数据集场景下排序效率很高。
public static int[] sort(int[] arr) throws Exception {
// 开始遍历第一个元素后的所有元素
for (int i = 1; i < arr.length; i++) {
// 需要插入的元素
int tmp = arr[i];
// 从已排序最后一个元素开始,如果当前元素比插入元素大,就往后移动