排序算法
排序算法的介绍
排序也称排序算法(Sort Algorithm),排序是将一组数据,依指定的顺序进行排列的过程。
排序的分类:
-
内部排序:
指将需要处理的所有数据都加载到内部存储器**(内存)**中进行排序。
-
外部排序法:
数据量过大,无法全部加载到内存中,需要借助外部存储**(文件等)**进行排序。
-
常见的排序算法分类(见右图):
算法的时间复杂度
度量一个程序(算法)执行时间的两种方法
-
事后统计的方法
这种方法可行, 但是有两个问题:一是要想对设计的算法的运行性能进行评测,需要实际运行该程序;二是所得时间的统计量依赖于计算机的硬件、软件等环境因素, 这种方式,要在同一台计算机的相同状态下运行,才能比较那个算法速度更快。
-
事前估算的方法
通过分析某个算法的时间复杂度来判断哪个算法更优.
时间频度
基本介绍
时间频度:一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为 T(n)。[举例说明]
举例说明-基本案例
比如计算 1-100 所有数字之和, 我们设计两种算法:
举例说明-忽略常数项
结论:
-
2n+20 和 2n 随着 n 变大,执行曲线无限接近, 20 可以忽略
-
3n+10 和 3n 随着 n 变大,执行曲线无限接近, 10 可以忽略
举例说明-忽略低次项
结论:
-
2n^2+3n+10 和 2n^2 随着 n 变大, 执行曲线无限接近, 可以忽略 3n+10
-
n^2+5n+20 和 n^2 随着 n 变大,执行曲线无限接近, 可以忽略 5n+20
举例说明-忽略系数
结论:
-
随着 n 值变大,5n^2+7n 和 3n^2 + 2n ,执行曲线重合, 说明 这种情况下, 5 和 3 可以忽略。
-
而 n^3+5n 和 6n^3+4n ,执行曲线分离,说明多少次方式关键
时间复杂度
-
一般情况下,算法中的基本操作语句的重复执行次数是问题规模 n 的某个函数,用 T(n)表示,若有某个辅助函数 f(n),使得当 n 趋近于无穷大时,T(n) / f(n) 的极限值为不等于零的常数,则称 f(n)是 T(n)的同数量级函数。 记作 T(n)=O( f(n) ),称O( f(n) ) 为算法的渐进时间复杂度,简称时间复杂度。
-
T(n) 不同,但时间复杂度可能相同。 如:T(n)=n²+7n+6 与 T(n)=3n²+2n+2 它们的 T(n) 不同,但时间复杂度相同,都为 O(n²)。
-
计算时间复杂度的方法:
- 用常数 1 代替运行时间中的所有加法常数 T(n)=n²+7n+6 => T(n)=n²+7n+1
- 修改后的运行次数函数中,只保留最高阶项 T(n)=n²+7n+1 => T(n) = n²
- 去除最高阶项的系数 T(n) = n² => T(n) = n² => O(n²)
常见的时间复杂度
-
常数阶 O(1)
-
对数阶 O(log2n)
-
线性阶 O(n)
-
线性对数阶 O(nlog2n)
-
平方阶 O(n^2)
-
立方阶 O(n^3)
-
k 次方阶 O(n^k)
-
指数阶 O(2^n)
常见的时间复杂度对应的图:
说明:
-
常见的算法时间复杂度由小到大依次为:Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)< Ο(nk) < Ο(2n) ,随着问题规模 n 的不断增大,上述时间复杂度不断增大,算法的执行效率越低
-
从图中可见,我们应该尽可能避免使用指数阶的算法
常数阶 O(1)
对数阶 O(log2n)
线性阶 O(n)
线性对数阶 O(nlogN)
平方阶 O(n²)
立方阶 O(n³)、K 次方阶 O(n^k)
说明:参考上面的 O(n²) 去理解就好了,O(n³)相当于三层 n 循环,其它的类似
平均时间复杂度和最坏时间复杂度
-
平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间。
-
最坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长。
-
平均时间复杂度和最坏时间复杂度是否一致,和算法有关(如图:)。
算法的空间复杂度简介
基本介绍
-
类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)定义为该算法所耗费的存储空间,它也是问题规模 n 的函数。
-
空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模 n 有关,它随着 n 的增大而增大,当 n 较大时,将占用较多的存储单元,例如快速排序和归并排序算法基数排序就属于这种情况
-
在做算法分析时,主要讨论的是时间复杂度。从用户使用体验上看,更看重的程序执行的速度。一些缓存产品 (redis, memcache)和算法(基数排序)本质就是用空间换时间.
冒泡排序
基本介绍
冒泡排序(Bubble Sorting)的基本思想是:通过对待排序序列从前向后(从下标较小的元素开始),依次比较相邻元素的值,若发现逆序则交换,使值较大的元素逐渐从前移向后部,就象水底下的气泡一样逐渐向上冒。
冒泡排序,每一次比较都会交换,产生冒泡的效果。
对双层for的优化都在于,能否在某次就已经排序完成,从而终止后面无效循环
冒泡函数由于在每一轮循环中都对所有元素进行了冒泡交换,所以当某一次没有发生一次交换时即已经有序
优化:
因为排序的过程中,各元素不断接近自己的位置,如果一趟比较下来没有进行过交换,就说明序列有序,因此要在排序过程中设置一个标志 flag 判断元素是否进行过交换。从而减少不必要的比较。(这里说的优化,可以在冒泡排序写好后,在进行)
演示冒泡过程
小结上面的图解过程:
-
一共进行 数组的大小-1 次 大的循环
-
每一趟排序的次数在逐渐的减少
-
如果我们发现在某趟排序中,没有发生一次交换, 可以提前结束冒泡排序。这个就是优化
代码实现
package chasing.sort;
import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;
/**
* @author 柴柴快乐每一天
* @create 2021-05-22 7:28 下午
* <p>
* 『Stay hungry, stay foolish. 』
*/
public class BubbleSort {
public static void main(String[] args) {
// int arr[] = {3, 9, -1, 10, 20};
//
// System.out.println("排序前");
// System.out.println(Arrays.toString(arr));
//
// bubbleSort(arr);
// System.out.println("排序后");
// System.out.println(Arrays.toString(arr));
int[] arr = new int[80000];
for(int i =0; i < 80000;i++) {
arr[i] = (int)(Math.random() * 8000000); //生成一个[0, 8000000) 数
}
Date data1 = new Date();
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat.format(data1);
System.out.println("排序前的时间是=" + date1Str);
//测试冒泡排序
bubbleSort(arr);
Date data2 = new Date();
String date2Str = simpleDateFormat.format(data2);
System.out.println("排序后的时间是=" + date2Str);
}
public static void bubbleSort(int[] arr){
int temp = 0;
boolean flag = false;
// 循环次数,排序几轮,相当于给数组中的每一个数找位置
for (int i = 0; i < arr.length-1; i++) {
// 最大的数依次向后面冒泡,即最后几位已经有序
for (int j = 0; j < arr.length-1 - i; j++) {
if (arr[j] > arr[j+1]) {
flag = true;
temp = arr[j];
arr[j] = arr[j+1];
arr[j+1] = temp;
}
}
// 如果在某一轮冒泡中,一次交换都没有发生过,则说明已经有序,不必在进行后面几轮冒泡
if (flag == false) {
break;
} else {
// 重置flag,进行下次判断
flag = false;
}
}
}
}
选择排序
基本介绍
选择式排序也属于内部排序法,是从欲排序的数据中,按指定的规则选出某一元素,再依规定交换位置后达到排序的目的。
选择排序优化在于选择到最小值是是否交换,最小值实际上是与第i小的值交换,若最小值就是i,就可以不用交换,进行下一轮选择
当minIndex == i 说明选择出的最小值就是第i小的,就不用交换。
选择排序思想:
选择排序(select sorting)也是一种简单的排序方法。它的基本思想是:第一次从 arr[0]~arr[n-1]中选取最小值, 与 arr[0]交换,第二次从 arr[1]~arr[n-1]中选取最小值,与 arr[1]交换,第三次从 arr[2]~arr[n-1]中选取最小值,与 arr[2] 交换,…,第 i 次从 arr[i-1]~arr[n-1]中选取最小值,与 arr[i-1]交换,…, 第 n-1 次从 arr[n-2]~arr[n-1]中选取最小值,与 arr[n-2]交换,总共通过 n-1 次,得到一个按排序码从小到大排列的有序序列。
选择排序思路分析图:
代码实现
public class SelectSort {
public static void main(String[] args) {
// int arr[] = {3, 9, -1, 10, 20};
//
// System.out.println("排序前");
// System.out.println(Arrays.toString(arr));
//
// selectSort(arr);
// System.out.println("排序后");
// System.out.println(Arrays.toString(arr));
int[] arr = new int[80000];
for (int i = 0; i < 80000; i++) {
arr[i] = (int) (Math.random() * 8000000); // 生成一个[0, 8000000) 数
}
System.out.println("排序前");
//System.out.println(Arrays.toString(arr));
Date data1 = new Date();
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat.format(data1);
System.out.println("排序前的时间是=" + date1Str);
selectSort(arr);
Date data2 = new Date();
String date2Str = simpleDateFormat.format(data2);
System.out.println("排序前的时间是=" + date2Str);
}
public static void selectSort(int[] arr){
int min = arr[0];
int minIndex = 0;
for (int i = 0; i < arr.length-1; i++) {
min = arr[i];
minIndex = i;
for (int j = i+1; j < arr.length; j++) {
if (arr[j] < min) {
// 重置最小值和最小值下标,并未发生交换
min = arr[j];
minIndex = j;
}
}
// 对双层for的优化都在于,能否在某次就已经排序完成,从而终止后面无效循环
// 冒泡函数由于在每一轮循环中都对所有元素进行了冒泡交换,所以当某一次没有发生一次交换时即已经有序。
// 选择排序优化在于选择到最小值是是否交换,最小值实际上是与第i小的值交换,若最小值就是i,就可以不用交换,进行下一轮选择
// 当minIndex == i 说明选择出的最小值就是第i小的,就不用交换。
if (minIndex != i){
// 交换过程
arr[minIndex] = arr[i];
arr[i] = min;
}
}
}
}
插入排序
插入排序法介绍:
插入式排序属于内部排序法,是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的。
插入排序法思想:
插入排序(Insertion Sorting)的基本思想是:把 n 个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有 n-1 个元素,排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表。
插入排序思路图:
代码实现
package chasing.sort;
import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;
/**
* @author 柴柴快乐每一天
* @create 2021-05-22 8:36 下午
* <p>
* 『Stay hungry, stay foolish. 』
*/
public class InsertSort {
public static void main(String[] args) {
// int arr[] = {3, 9, -1, 10, 20};
//
// System.out.println("排序前");
// System.out.println(Arrays.toString(arr));
//
// insertSort(arr);
// System.out.println("排序后");
// System.out.println(Arrays.toString(arr));
int[] arr = new int[80000];
for (int i = 0; i < 80000; i++) {
arr[i] = (int) (Math.random() * 8000000); // 生成一个[0, 8000000) 数
}
System.out.println("插入排序前");
Date data1 = new Date();
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat.format(data1);
System.out.println("排序前的时间是=" + date1Str);
insertSort(arr); //调用插入排序算法
Date data2 = new Date();
String date2Str = simpleDateFormat.format(data2);
System.out.println("排序前的时间是=" + date2Str);
}
public static void insertSort(int[] arr){
int insertValue = 0;
int insertIndex = 0;
for (int i = 1; i < arr.length; i++) {
// 定义待插入的值,待插入的值即为无序列表的第一个
// 待插入位置即为待插入值前面一个
insertValue = arr[i];
insertIndex = i-1;
// insertIndex >= 0防止插入位置越界
// insertValue < arr[insertIndex] 说明还没有找到插入位置
// insertValue比arr[insertIndex]小,就该排在其前面,所以将arr[insertIndex]后移
while (insertIndex >= 0 && insertValue < arr[insertIndex]) {
arr[insertIndex+1] = arr[insertIndex];
insertIndex--;
}
// 当退出循环时,说明插入的位置找到,insertIndex+1
// 不必判断insertIndex!=i,负优化,赋值比判断快
arr[insertIndex+1] = insertValue;
}
}
}
希尔排序
简单插入排序存在的问题
我们看简单的插入排序可能存在的问题.
数组 arr = {2,3,4,5,6,1} 这时需要插入的数 1(最小), 这样的过程是:
{2,3,4,5,6,6}
{2,3,4,5,5,6}
{2,3,4,4,5,6}
{2,3,3,4,5,6}
{2,2,3,4,5,6}
{1,2,3,4,5,6}
结论: 当需要插入的数是较小的数时,后移的次数明显增多,对效率有影响.
希尔排序法介绍
希尔排序是希尔(Donald Shell)于 1959 年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序。
希尔排序法基本思想
希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至 1 时,整个文件恰被分成一组,算法便终止
开始时,gap取值较大,子序列中的元素较少,排序速度快,克服了直接插入排序的缺点;其次,gap值逐渐变小后,虽然子序列的元素逐渐变多,但大多元素已基本有序,所以继承了直接插入排序的优点,能以近线性的速度排好序。
步长的选择是希尔排序的重要部分。只要最终步长为1任何步长序列都可以工作。算法最开始以一定的步长进行排序。然后会继续以一定步长进行排序,最终算法以步长为1进行排序。当步长为1时,算法变为插入排序,这就保证了数据一定会被排序。
希尔排序法的示意图
代码实现
对各个组进行插入排序时,并不是相对一个组排序完,再对另一个组进行排序,而是轮流对每个组进行插入排序。
交换法
package main.java.chasing.sort;
import org.junit.Test;
import java.util.Arrays;
/**
* @author 柴柴快乐每一天
* @create 2021-05-23 8:24 下午
* <p>
* 『Stay hungry, stay foolish. 』
*/
public class ShellSort {
@Test
public void test1(){
int[] arr = { 8, 9, 1, 7, 2, 3, 5, 4, 6, 0 };
System.out.println("排序前");
System.out.println(Arrays.toString(arr));
shellSort(arr);
System.out.println("排序后");
System.out.println(Arrays.toString(arr));
}
public static void shellSort(int[] arr){
int temp = 0;
int count = 0;
// 根据前面的逐步分析,使用循环处理
// gap不仅仅是组数,更重要是作为步长
for (int gap = arr.length / 2; gap > 0; gap /= 2) {
// 让i从gap算起,大幅度减少外层循环,且也能遍历完每种情况
for (int i = gap; i < arr.length; i++) {
// 遍历各组中所有的元素(共gap组,每组有个元素), 步长gap
// 其实是从头到尾一个个遍历的,但是不是相邻比较,而是跨步长比较
for (int j = i - gap; j >= 0; j -= gap) {
// 如果当前元素大于加上步长后的那个元素,说明交换
if (arr[j] > arr[j + gap]) {
temp = arr[j];
arr[j] = arr[j + gap];
arr[j + gap] = temp;
}
}
}
//System.out.println("希尔排序第" + (++count) + "轮 =" + Arrays.toString(arr));
}
}
}
移位法
package main.java.chasing.sort;
import org.junit.Test;
import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;
/**
* @author 柴柴快乐每一天
* @create 2021-05-23 8:24 下午
* <p>
* 『Stay hungry, stay foolish. 』
*/
public class ShellSort {
@Test
public void test1(){
int[] arr = { 8, 9, 1, 7, 2, 3, 5, 4, 6, 0 };
System.out.println("排序前");
System.out.println(Arrays.toString(arr));
shellSort2(arr);
System.out.println("排序后");
System.out.println(Arrays.toString(arr));
}
@Test
public void test2(){
int[] arr = new int[8000000];
for (int i = 0; i < 8000000; i++) {
arr[i] = (int) (Math.random() * 8000000); // 生成一个[0, 8000000) 数
}
System.out.println("插入排序前");
Date data1 = new Date();
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat.format(data1);
System.out.println("排序前的时间是=" + date1Str);
shellSort2(arr); //调用插入排序算法
Date data2 = new Date();
String date2Str = simpleDateFormat.format(data2);
System.out.println("排序前的时间是=" + date2Str);
}
public static void shellSort2(int[] arr){
// 增量gap,并逐步缩小增量
for (int gap = arr.length / 2; gap > 0; gap /= 2) {
// 从第gap个元素,逐个对其所在的组进行直接插入排序
for (int i = gap; i < arr.length; i++){
int temp = arr[i];
int j = i-gap;
while (j >= 0 && temp < arr[j]) {
arr[j+gap] = arr[j];
j -= gap;
}
arr[j+gap] = temp;
}
}
}
}
快速排序
快速排序法介绍:
快速排序(Quicksort)是对冒泡排序的一种改进。基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列
快速排序法示意图:
pivot不是一个位置,是一个值,这个值的位置是可能会被改变的。
代码实现
package main.java.chasing.sort;
import org.junit.Test;
import java.util.Arrays;
/**
* @author 柴柴快乐每一天
* @create 2021-05-24 8:49 下午
* <p>
* 『Stay hungry, stay foolish. 』
*/
public class QuickSort {
@Test
public void test(){
//int[] arr = {-9,78,0,23,-567,70,70,-3, -1,900, 4561};
int[] arr = {3,2,6,5,8,4,1};
quickSort(arr, 0, arr.length-1);
System.out.println("arr=" + Arrays.toString(arr));
}
public static void quickSort(int[] arr, int left, int right) {
int l = left;
int r = right;
int pivot = arr[(left+right)/2];
int temp = 0;
while (l < r) {
// 最坏的情况是左边找不到比pivot大的,直到找到pivot本身然后退出
while (arr[l] < pivot){
l++;
}
while (arr[r] > pivot) {
r--;
}
// 说明左边的值已全部小于pivot,右边的值已全部小于pivot
if (l >= r) {
break;
}
temp = arr[l];
arr[l] = arr[r];
arr[r] = temp;
// 处理交换后的一些特殊情况
// arr[l] 的值是由右边的换过来的,如果已经等于pivot了,那么右边的指针前移一下,找下一个
// 而有了这两个if,可以保证出现与pivot相同值时可以跳出去
if (arr[l] == pivot) {
// 不能写成l++,这样写能解决重复值的跳出
// 但是解决不了一般的情况了,当pivot的位置被改变,此时指针还指着pivot
// 那么pivot的指针不能动,我pivot还等着别人来跟我交换呢,指针一旦动了,别人就找不到了
r--;
}
if (arr[r] == pivot) {
l++;
}
}
if(l == r) {
l++;
r--;
}
if (left < r){
// 向左递归到底
quickSort(arr, left, r);
}
if (right > l) {
quickSort(arr, l, right);
}
}
}
归并排序
归并排序介绍:
归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。
归并排序思想示意图
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CgALWvZh-1633318539827)(https://chasing1874.oss-cn-chengdu.aliyuncs.com/image-20210525101354732.png)]
代码演示
package main.java.chasing.sort;
import org.junit.Test;
import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;
/**
* @author 柴柴快乐每一天
* @create 2021-05-25 10:20 上午
* <p>
* 『Stay hungry, stay foolish. 』
*/
public class MergeSort {
@Test
public void test1(){
int[] arr = { 8, 9, 1, 7, 2, 3, 5, 4, 6, 0 };
System.out.println("排序前");
System.out.println(Arrays.toString(arr));
int[] temp = new int[11];
mergeSort(arr, 0, arr.length-1, temp);
System.out.println("排序后");
System.out.println(Arrays.toString(arr));
}
@Test
public void test2(){
int[] arr = new int[8000000];
for (int i = 0; i < 8000000; i++) {
arr[i] = (int) (Math.random() * 8000000); // 生成一个[0, 8000000) 数
}
System.out.println("插入排序前");
Date data1 = new Date();
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat.format(data1);
System.out.println("排序前的时间是=" + date1Str);
int[] temp = new int[8000000];
mergeSort(arr, 0, arr.length-1, temp); //调用插入排序算法
Date data2 = new Date();
String date2Str = simpleDateFormat.format(data2);
System.out.println("排序前的时间是=" + date2Str);
}
public static void mergeSort(int[] arr, int left, int right, int temp[]) {
// 递归终止条件
if (left < right) {
int mid = (left + right) / 2;
mergeSort(arr, left, mid, temp);
mergeSort(arr, mid+1, right, temp);
merge(arr, left, mid, right, temp);
}
}
public static void merge(int arr[], int left, int mid, int right, int[] temp) {
// i 为左边有序序列的初始索引,j为右边的,t为辅助数组的索引
int i = left;
int j = mid+1;
int t = 0;
while (i <= mid && j <= right) {
if (arr[i] <= arr[j]) {
temp[t] = arr[i];
t++;
i++;
} else {
temp[t] = arr[j];
j++;
t++;
}
}
// 当上述循环退出时,说明某一个有序序列已经遍历完
while (i <= mid) {
temp[t] = arr[i];
t++;
i++;
}
while (j <= right) {
temp[t] = arr[j];
t++;
j++;
}
// 拷贝数组
t = 0;
int tempLeft = left;
while (tempLeft <= right) {
arr[tempLeft] = temp[t];
tempLeft++;
t++;
}
}
}
基数排序
基数排序(桶排序)介绍:
-
基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或 bin sort,顾名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用
-
基数排序法是属于稳定性的排序,基数排序法的是效率高的稳定性排序法
-
基数排序(Radix Sort)是桶排序的扩展
-
基数排序是 1887 年赫尔曼·何乐礼发明的。它是这样实现的:将整数按位数切割成不同的数字,然后按每个位数分别比较。
基数排序基本思想
将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。
基数排序图文说明
将数组 {53, 3, 542, 748, 14, 214} 使用基数排序, 进行升序排序
代码实现
package main.java.chasing.sort;
import org.junit.Test;
import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;
/**
* @author 柴柴快乐每一天
* @create 2021-05-25 8:15 下午
* <p>
* 『Stay hungry, stay foolish. 』
*/
public class RadixSort {
@Test
public void test1(){
int[] arr = { 8, 9, 1, 7, 2, 3, 5, 4, 6, 0 };
System.out.println("排序前");
System.out.println(Arrays.toString(arr));
radixSort(arr);
System.out.println("排序后");
System.out.println(Arrays.toString(arr));
}
@Test
public void test2(){
int[] arr = new int[10000000];
for (int i = 0; i < 10000000; i++) {
arr[i] = (int) (Math.random() * 8000000); // 生成一个[0, 8000000) 数
}
System.out.println("插入排序前");
Date data1 = new Date();
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat.format(data1);
System.out.println("排序前的时间是=" + date1Str);
radixSort(arr); //调用插入排序算法
Date data2 = new Date();
String date2Str = simpleDateFormat.format(data2);
System.out.println("排序前的时间是=" + date2Str);
}
public void radixSort(int[] arr) {
int max = arr[0];
for (int i = 0; i < arr.length; i++) {
if (arr[i] > max) {
max = arr[i];
}
}
int maxLength = (max+"").length();
int bucket[][] = new int[10][arr.length];
int bucketLength[] = new int[10];
for (int i = 0, n = 1; i < maxLength; i++, n *= 10) {
for (int j = 0; j < arr.length; j++) {
int digitOfElement = arr[j] / n % 10;
bucket[digitOfElement][bucketLength[digitOfElement]] = arr[j];
bucketLength[digitOfElement]++;
}
int index = 0;
for (int l = 0; l < bucket.length; l++){
if (bucketLength[l] != 0){
for (int k = 0; k < bucketLength[l]; k++) {
arr[index] = bucket[l][k];
index++;
}
}
bucketLength[l] = 0;
}
}
}
}
基数排序的说明:
- 基数排序是对传统桶排序的扩展,速度很快.
- 基数排序是经典的空间换时间的方式,占用内存很大, 当对海量数据排序时,容易造成 OutOfMemoryError 。
- 基数排序时稳定的。[注:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且 r[i]在 r[j]之前,而在排序后的序列中,r[i]仍在 r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的]
- 有负数的数组,我们不用基数排序来进行排序, 如果要支持负数,参考: https://code.i-harness.com/zh-CN/q/e98fa9
常用排序算法总结和对比
一张排序算法的比较图
相关术语解释:
- 稳定:如果 a 原本在 b 前面,而 a=b,排序之后 a 仍然在 b 的前面;
- 不稳定:如果 a 原本在 b 的前面,而 a=b,排序之后 a 可能会出现在 b 的后面;
- 内排序:所有排序操作都在内存中完成;
- 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
- 时间复杂度: 一个算法执行所耗费的时间。
- 空间复杂度:运行完一个程序所需内存的大小。
- n: 数据规模
- k: “桶”的个数
- In-place: 不占用额外内存
- Out-place: 占用额外内存