原理:
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
代码实现:
public void mergeSort(int[] array){
mergeInterval(array,0,array.length-1);
}
private void mergeInterval(int[] array, int start, int end) {
if(start >= end){
return;
}
int mid = (start+end)/2;
mergeInterval(array,start,mid);
mergeInterval(array,mid+1,end);
merge(array,start,mid,end);
}
private void merge(int[] array, int start, int mid, int end) {
int[] temp = new int[end-start+1];
int saveStart = start;
int index = 0;
int oStart = mid + 1;
while(start <= mid && oStart <= end){
if(array[start] <= array[oStart]){
temp[index++] = array[start++];
}else{
temp[index++] = array[oStart++];
}
}
while(start <= mid){
temp[index++] = array[start++];
}
while(oStart <= end){
temp[index++] = array[oStart++];
}
for (int num : temp) {
array[saveStart++] = num;
}
}
时间复杂度: O(nlogn) 数据不敏感 稳定
海量数据的排序问题
外部排序:排序过程需要在磁盘等外部存储进行的排序
前提:内存只有 1G,需要排序的数据有 100G
因为内存中因为无法把所有数据全部放下,所以需要外部排序,而归并排序是最常用的外部排序:
- 先把文件切分成 200 份,每个 512 M
- 分别对 512 M 排序,因为内存已经可以放的下,所以任意排序方式都可以
- 进行 200 路归并,同时对 200 份有序文件做归并过程,最终结果就有序了