归并排序
- 时间复杂度:O ( N * logzN ) 每一层都是N,有log2N层
- 空间复杂度:O(N),每个区间都会申请内存,最后申请的数组大小和array大小相同
- 稳定性:稳定
目前为止,稳定的排序有:插入、冒泡、归并
- 归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,采用了分治法
- 将待排序列分解,先使每个子序列有序,再使子序列段间有序
- 将已有序的子序列合并,得到完全有序的序列
- 若将两个有序表合并成一个有序表,称为二路归并
1.递归实现
- 1.确定递归的结束条件,求出中间数mid,
- 2.进行分解,根据mid来确定递归的区间大小
- 3.递归分解完左边,然后递归分解右边
- 4.左右分解完成后,进行合并
- 5.申请新数组进行合并,比较两个数组段,记得查漏补缺
- 6.和并的时候要对齐下标,每个tmp的下标要找到array中对应的下标
/**
* 归并排序
* @param array
*/
public static void mergeSort(int[] array) {
mergeSortFunc(array,0,array.length-1);
}
private static void mergeSortFunc(int[] array, int left, int right) {
//结束条件
if (left >= right) {
return;
}
//进行分解
int mid = (left + right) / 2;
mergeSortFunc(array, left, mid);
mergeSortFunc(array, mid + 1, right);
//左右分解完成后,进行合并
merge(array, left, right, mid);
}
//进行合并
private static void merge(int[] array, int start, int end, int mid) {
int s1 = start;
int s2 = mid + 1;
int[] tmp = new int[end - start + 1];
int k = 0;//k为tmp数组的下标
while (s1 <= mid && s2 <= end) {//两个数组中都有数据
//进行比较,放到新申请的数组
if (array[s1] <= array[s2]) {
tmp[k++] = array[s1++];
} else {
tmp[k++] = array[s2++];
}
}
//因为有&&条件,数组不一定走完
while (s1 <= mid) {
tmp[k++] = array[s1++];
}
while (s2 <= end) {
tmp[k++] = array[s2++];
}
//此时,将排好的tmp数组的数组,拷贝到array
for (int i = 0; i < tmp.length; i++) {
array[i+start] = tmp[i];//对齐下标
}
}
2.非递归实现
- 1.从1开始分组,先保证每个数都是独立有序的
- 2.进行循环,i下标从0开始,每次跳转组数的两倍
- 3.根据left = i,求出mid和right
- 4.要避免mid和right越界
- 5.分组进行合并
- 6.二倍数扩大组数
/***
* 归并排序,非递归实现
* @param array
*/
public static void mergeSort2(int[] array) {
int gap = 1;
while (gap < array.length) {
//i += gap * 2 i每次跳到下一组
for (int i = 0; i < array.length; i += gap * 2) {
int left = i;
//要避免mid和right越界
int mid = left + gap - 1;
if(mid>=array.length){
mid = array.length-1;//修正越界的情况
}
int right = mid + gap;
if (right>=array.length){//修正越界的情况
right = array.length-1;
}
merge(array,left,right,mid);//进行合并
}
gap *=2;//2倍数扩大组数
}
}
//进行合并
private static void merge(int[] array, int start, int end, int mid) {
int s1 = start;
int s2 = mid + 1;
int[] tmp = new int[end - start + 1];
int k = 0;//k为tmp数组的下标
while (s1 <= mid && s2 <= end) {//两个数组中都有数据
//进行比较,放到新申请的数组
if (array[s1] <= array[s2]) {
tmp[k++] = array[s1++];
} else {
tmp[k++] = array[s2++];
}
}
//因为有&&条件,数组不一定走完
while (s1 <= mid) {
tmp[k++] = array[s1++];
}
while (s2 <= end) {
tmp[k++] = array[s2++];
}
//此时,将排好的tmp数组的数组,拷贝到array
for (int i = 0; i < tmp.length; i++) {
array[i + start] = tmp[i];//对齐下标
}
}
3.海量数据的排序问题
外部排序:排序过程需要在磁盘等外部存储进行的排序
前提:内存只有 1G,需要排序的数据有 100G
因为内存中因为无法把所有数据全部放下,所以需要外部排序,而归并排序是最常用的外部排序
- 先把文件切分成 200 份,每个 512 M
- 分别对 512 M 排序,因为内存已经可以放的下,所以任意排序方式都可以
- 进行 2路归并,同时对 200 份有序文件做归并过程,最终结果就有序了