1.归并排序
1.1 归并排序介绍:
归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer) 策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。
1.2 归并排序思想示意图 1-基本思想:
1.3 归并排序思想示意图 2-合并相邻有序子序列:
再来看看治阶段,我们需要将两个已经有序的子序列合并成一个有序序列,比如上图中的最后一次合并,要将
[4,5,7,8]和[1,2,3,6]两个已经有序的子序列,合并为最终序列[1,2,3,4,5,6,7,8],来看下实现步骤:
1.4 归并排序的代码实现
- 拆分过程:
//分+合方法
public static void mergeSort(int[] arr , int left,int right,int[] temp){
if(left < right){
int mid = (left + right) / 2;//中间索引
//向左递归分解
mergeSort(arr,left,mid,temp);
//向右递归分解
mergeSort(arr,mid + 1,right,temp);
merge(arr, left, mid, right, temp);
}
}
- 合并过程:
/***
*
* @param arr 排序的原始数组
* @param left 左边有序序列的初始索引
* @param mid 中间索引
* @param right右边索引
* @param temp 做中转的数组
*/
public static void merge(int[] arr,int left,int mid,int right,int[] temp){
//System.out.println("XXXXXXX");
int i = left; //初始化i,左边有序序列的初始索引
int j = mid + 1;//初始化j,右边有序序列的初始索引
int t = 0; //指向temp数组的当前索引
//(一)
//先把左右两边(有序)的数组按照规则填充到temp数组
//直到左右两边的有序序列有一边处理完毕为止
while(i <= mid && j <= right){
//如果左边的有序序列的当前元素小于等于右边有序序列的当前元素 将左边的当前元素填充到temp数组
if(arr[i] < arr[j]){
temp[t] = arr[i];
t += 1;
i += 1;
}else { //反之,将右边有序序列的当前元素填充到temp数组
temp[t] = arr[j];
t += 1;
j += 1;
}
}
//(二)
//把有剩余的数据的一遍的数据依次全部填充到temp
while(i <= mid){//左边有序序列还有剩余的元素,就全部填充到temp
temp[t] = arr[i];
t += 1;
i += 1;
}
// 把有剩余的数据的一遍的数据依次全部填充到temp
while (j <= right) {// 右边有序序列还有剩余的元素,就全部填充到temp
temp[t] = arr[j];
t += 1;
j += 1;
}
//(三)
//将temp数组的元素拷贝到arr
//注意:并不是每次都要拷贝所有
t = 0;
int tempLeft = left;
//第一次合并 tempLeft = 0; right = 1;最后一次 tempLeft = 0 right = 7
//System.out.println("tempLeft="+tempLeft +" right="+right);
while(tempLeft <= right){
arr[tempLeft] = temp[t];
t +=1;
tempLeft += 1;
}
}
1.5 归并排序的性能测试
随机生成80000个整数进行排序测试
public static void main(String[] args) {
// TODO Auto-generated method stub
//int[] arr = {8,4,5,7,1,3,6,2};
int[] arr = new int[8000000];
for(int i = 0 ; i < 8000000; i++){
arr[i] = (int)(Math.random() * 8000000);//生成一个[0,800000]之间的数
}
Date date1 = new Date();
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat.format(date1);
System.out.println("排序前的时间是:"+date1Str);
int[] temp = new int[arr.length];
mergeSort(arr,0,arr.length - 1,temp);
//System.out.println("合并后的数组为:"+Arrays.toString(arr));
Date date2 = new Date();
String date2Str = simpleDateFormat.format(date2);
System.out.println("排序后的时间是:"+date2Str);
}
运行结果如下:
2. 基数排序
2.1 基数排序(桶排序)介绍:
- 基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或 bin sort,顾名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用
- 基数排序法是属于稳定性的排序,基数排序法的是效率高的稳定性排序法
- 基数排序(Radix Sort)是桶排序的扩展
- 基数排序是 1887 年赫尔曼•何乐礼发明的。它是这样实现的:将整数按位数切割成不同的数字,然后按每个位数分别比较。
2.2 基数排序基本思想
- 将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。
- 这样说明,比较难理解,下面我们看一个图文解释,理解基数排序的步骤
2.3 基数排序图文说明
将数组 {53, 3, 542, 748, 14, 214} 使用基数排序, 进行升序排序
2.4 基数排序代码实现
//基数排序方法
public static void radixSort(int[] arr){
// 根据前面的推导过程,我们可以得到最终的基数排序的代码
int max = arr[0];
for (int i = 1; i < arr.length; i++) {
if (arr[i] > max) {
max = arr[i];
}
}
// 得到最大数是几位数
int maxLength = (max + "").length();
for (int i = 0, n = 1; i < maxLength; i++, n *= 10) {
int[][] bucket = new int[10][arr.length];
// 为了记录每个桶中,实际存放了多少个数据,定义一个一维数组来记录各个桶的每次放入的数据个数
int[] bucketElementCounts = new int[10];
for (int j = 0; j < arr.length; j++) {
// 取出每个元素的各位的值
int digitOfElement = arr[j] / n % 10;
// 放入到对应的桶中
bucket[digitOfElement][bucketElementCounts[digitOfElement]] = arr[j];
bucketElementCounts[digitOfElement]++;
}
// 按照桶的顺序依次取出数据放入原来的数组中
int index = 0;
// 遍历每一个桶,并将桶中数据放入原来的数组中
for (int k = 0; k < bucketElementCounts.length; k++) {
if (bucketElementCounts[k] != 0) {
// 循环该桶即第K个桶
for (int l = 0; l < bucketElementCounts[k]; l++) {
arr[index++] = bucket[k][l];
}
}
// 需要将每个bucketElementCounts[k] = 0
bucketElementCounts[k] = 0;
}
//System.out.println("第" + (i + 1) + "轮处理后数组为:" + Arrays.toString(arr));
}
}
2.5 基数排序性能测试
public static void main(String[] args) {
// TODO Auto-generated method stub
//int[] arr = {53, 3, 542, 748, 14, 214};
int[] arr = new int[80000];
for(int i = 0 ; i < 80000; i++){
arr[i] = (int)(Math.random() * 80000);//生成一个[0,80000]之间的数
}
Date date1 = new Date();
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat.format(date1);
System.out.println("排序前的时间是:"+date1Str);
radixSort(arr);
Date date2 = new Date();
String date2Str = simpleDateFormat.format(date2);
System.out.println("排序后的时间是:"+date2Str);
}
运行结果如下:
2.6 基数排序的说明:
- 基数排序是对传统桶排序的扩展,速度很快.
- 基数排序是经典的空间换时间的方式,占用内存很大, 当对海量数据排序时,容易造成 OutOfMemoryError 。
- 基数排序时稳定的。[注:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且 r[i]在 r[j]之前,而在排序后的序列中,r[i]仍在 r[j]之前, 则称这种排序算法是稳定的;否则称为不稳定的]
- 有负数的数组,我们不用基数排序来进行排序, 如果要支持负数,参考: https://code.i-harness.com/zh-CN/q/e98fa9
3 常用排序算法总结和对比
3.1 一张排序算法的比较图
3.2 相关术语解释:
- 稳定:如果 a 原本在 b 前面,而 a=b,排序之后 a 仍然在 b 的前面;
- 不稳定:如果 a 原本在 b 的前面,而 a=b,排序之后 a 可能会出现在 b 的后面;
- 内排序:所有排序操作都在内存中完成;
- 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
- 时间复杂度: 一个算法执行所耗费的时间。
- 空间复杂度:运行完一个程序所需内存的大小。
- n: 数据规模
- k: “桶”的个数
- In-place: 不占用额外内存
- Out-place: 占用额外内存