常见的排序算法实现

排序 概念

排序:是计算机程序设计中的一项重要操作,其功能是指一个数据元素集合或序列重新排列成一个按数据元素某个数据项值有序的序列

排序码(关键码):排序依据的数据项

稳定排序:排序前与排序后相同关键码元素间的位置关系,保持一致的排序方法。

不稳定排序:排序前与排序后相同关键码元素间的相对位置发生改变的排序方法。
在这里插入图片描述

排序分为两类:
1.内排序:指待排序列完全存放在内存中所进行的排序,内排序大致可分为五类:插入排序、交换排序、选择排序、归并排序和基数排序

2.外排序:指排序过程中还需访问外存储器的排序

在这里插入图片描述
在这里插入图片描述
相关术语解释:

  1. 稳定:如果 a 原本在 b 前面,而 a=b,排序之后 a 仍然在 b 的前面;

  2. 不稳定:如果 a 原本在 b 的前面,而 a=b,排序之后 a 可能会出现在 b 的后面;

  3. 内排序:所有排序操作都在内存中完成;

  4. 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;

  5. 时间复杂度: 一个算法执行所耗费的时间。

  6. 空间复杂度:运行完一个程序所需内存的大小。

  7. n: 数据规模

  8. k: “桶”的个数

  9. In-place: 不占用额外内存

  10. Out-place: 占用额外内存

交换排序(冒泡排序)

冒泡排序(Bubble Sorting)的基本思想是:通过对待排序序列从前向后(从下标较小的元素开始),依次比较相邻元素的值,若发现逆序则交换,使值较大的元素逐渐从前移向后部,就象水底下的气泡一样逐渐向上冒。

优化:
因为排序的过程中,各元素不断接近自己的位置,如果一趟比较下来没有进行过交换,就说明序列有序,因此要在排序过程中设置一个标志 flag 判断元素是否进行过交换。从而减少不必要的比较。

通过80000个随机数据测试所花时间大约7301ms

// 将冒泡排序算法封装成一个方法
public static void bubbleSort(int arr[]) {
	// 1.冒泡排序,就是将最大的数排在最后
	int temp = 0;
	boolean flag = false;//优化
	for (int i = 0; i < arr.length - 1; i++) {
		for (int j = 0; j < arr.length - 1 - i; j++) {
			// 如果前面的数比后面的大,就交换
			if (arr[j] > arr[j + 1]) {
				flag = true;
				temp = arr[j];
				arr[j] = arr[j + 1];
				arr[j + 1] = temp;
			}

		}
		if (!flag) {// 在一趟排序中,一次交换都没有发生过
			break;
		} else {
			flag = false;// 重置flag,进行下次判断
		}
	}
}

在这里插入图片描述

交换排序(快速排序)

快速排序(Quicksort)是对冒泡排序的一种改进。
基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列
在这里插入图片描述
代码实现:
八百万个随机数据测试所花时间大约800ms

public static void quickSort(int[] arr, int left, int right){
	int l = left;//左下标
	int r = right;//右下标
	//pivot 中轴
	int pivot = arr[(left + right) / 2];
	int temp = 0;//临时变量,作为交换时使用
	//while循环的目的是让比 pivot 值小的放到左边,大的放右边 
	while(l < r){
		//在pivot左边一直找,找到大于等于pivot值,才退出
		while(arr[l] < pivot){
			l += 1;
		}
		//在pivot右边一直找,找到小于等于pivot值,才退出
		while(arr[r] > pivot){
			r -= 1;
		}
		//如果 l >= r 说明pivot 的左右两边的值 ,已经分好
		if (l >= r){
			break;
		}
		
		//交换
		temp = arr[l];
		arr[l] = arr[r];
		arr[r] = temp;
		
		//如果交换完后,发现这个arr[l] == pivot值,前移
		if(arr[l] == pivot){
			r -= 1;
		}
		//如果交换完后,发现这个arr[r] == pivot值,后移
		if(arr[r] == pivot){
			l += 1;
		}
	}
	//如果 l == r , 必须 l++, r--,否则会出现栈溢出
	if(l == r){
		l += 1;
		r -= 1;
	}
	//向左递归
	if(left < r){
		quickSort(arr, left, r);
	}
	//向右递归
	if(right > l){
		quickSort(arr, l, right);
	}
}

时间复杂度: 长度为n的序列能折半logn次,一共折半n次,就是nlogn
空间复杂度: O(1)

选择排序(简单选择排序)

介绍:
选择式排序也属于内部排序法,是从欲排序的数据中,按指定的规则选出某一元素,再依规定交换位置后达到排序的目的。

选择排序思想:
选择排序(select sorting)也是一种简单的排序方法。它的基本思想是:第一次从 arr[0]~arr[n-1]中选取最小值, 与 arr[0]交换,第二次从 arr[1]~arr[n-1]中选取最小值,与 arr[1]交换,第三次从 arr[2]~arr[n-1]中选取最小值,与 arr[2] 交换,…,第 i 次从 arr[i-1]~arr[n-1]中选取最小值,与 arr[i-1]交换,…, 第 n-1 次从 arr[n-2]~arr[n-1]中选取最小值, 与 arr[n-2]交换,总共通过 n-1 次,得到一个按排序码从小到大排列的有序序列。
在这里插入图片描述

通过80000个随机数据测试所花时间大约1160ms

//选择排序
public static void selectSort(int[] arr) {
	//选择排序时间复杂度是 O(n^2) 
	for (int i = 0; i < arr.length - 1; i++) {
		int minIndex = i; 
		int min = arr[i];
		for (int j = i + 1; j < arr.length; j++) {
			if (min > arr[j]) { // 说明假定的最小值,并不是最小
				min = arr[j]; // 重 置 min 
				minIndex = j; // 重置 minIndex
			}
		}
	}
	// 将最小值,放在 arr[0],  即交换
	if (minIndex != i) { 
		arr[minIndex] = arr[i]; 
		arr[i] = min;
	}
}

在这里插入图片描述

选择排序(堆排序)

介绍
堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。
堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆, 注意 : 没有要求结点的左孩子的值和右孩子的值的大小关系。每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆
大顶堆举例说明
在这里插入图片描述
在这里插入图片描述
思想:
在这里插入图片描述
通过80000个随机数据测试所花时间大约1600ms

// 编写一个堆排序的方法
public static void heapSort(int arr[]) {
	int temp = 0;
	System.out.println("堆排序!");
	// 测试
	// adjustHeap(arr, 0, 5);
	// System.out.println(Arrays.toString(arr));

	// 完成最终代码
	// 将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆
	//arr.length / 2 - 1是第一个非叶子结点
	for (int i = arr.length / 2 - 1; i >= 0; i--) {
		adjustHeap(arr, i, arr.length);// [9, 6, 8, 5, 4]
	}
	// 2.将堆顶元素与末尾元素交换,将最大值沉到数组末端
	for (int j = arr.length - 1; j > 0; j--) {
		// 交换
		temp = arr[j];
		arr[j] = arr[0];
		arr[0] = temp;
		adjustHeap(arr, 0, j);
	}
//		System.out.println(Arrays.toString(arr));
}

// 将一个数组(二叉树),调整成一个大顶堆
/**
 * 功能:完成将以i对应的非叶子节点调整成大顶堆
 * @param arr
 *            待调整的数组
 * @param i
 *            表示非叶子节点再数组中的索引
 * @param lenght
 *            表示对多少个元素继续调整,length在逐渐减少
 */
public static void adjustHeap(int arr[], int i, int length) {
	int temp = arr[i];// 先取出当前元素的值,保存在临时变量
	// 开始调整
	// 说明:
	// 1.k = i * 2 + 1 k是i节点的左子节点
	for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {
		if (k + 1 < length && arr[k] < arr[k + 1]) {// 说明左子节点的值小于右子节点的值
			k++;// k指向右子节点
		}
		if (arr[k] > temp) {// 如果子节点大于父节点
			arr[i] = arr[k];// 把较大的值赋给当前的节点
			i = k;// i 指向 k,继续循环比较
		} else {
			break;// !
		}
	}
	// 当for循环结束后,我们已经将以i为父节点的树的最大值,放在了最顶上(局部)
	arr[i] = temp;// 将temp值放到调整后的位置
}

时间复杂度:调一次大根堆或者小根堆时间复杂度是logn,有n-1个元素带排序,(n-1)*log2n = nlog2n - log2n = O(nlogn)
空间复杂度:只用到了几个变量进行元素交换 所以是O(1)

插入排序(直接插入排序)

介绍
插入式排序属于内部排序法,是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的。

思想
入排序(Insertion Sorting)的基本思想是:把 n 个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有 n-1 个元素,排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表。
在这里插入图片描述

通过80000个随机数据测试所花时间大约1580ms

// 将插入排序算法封装成一个方法
public static void insetSort(int[] arr){
	int insertVal = 0;
	int insertIndex = 0;
	//使用for循环简化代码
	for (int i = 1; i < arr.length; i++) {
		//第1轮{101, 34, 119, 1} => {34, 101, 119, 1}
		//定义待插入的数
		insertVal = arr[i];
		insertIndex = i - 1;//即arr[1]的前面这个数的下标
		
		//给insertVal找到插入的位置
		//说明:
		//1. insertIndex >= 0 保证在给insertVla找插入位置,不越界                 
		//2. insertVal < arr[insertIndex] 待插入的数,还没有找到插入位置
		//3. 需要将arr[insertIndex] 后移再次判断
		while(insertIndex >= 0 && insertVal < arr[insertIndex]){
			arr[insertIndex + 1] = arr[insertIndex];
			insertIndex--;
		}
		//当退出while循环时,说明插入的位置找到,是insertIndex + 1
		
		//判断是否需要赋值
		if(insertIndex + 1 != i){
			arr[insertIndex + 1] = insertVal;				
		}
	}
}

在这里插入图片描述

插入排序(希尔排序)

希尔排序是希尔(Donald Shell)于 1959 年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为 缩小增量排序

我们看到简单的插入排序可能存在的问题.

数组 arr = {2,3,4,5,6,1} 这时需要插入的数 1(最小), 这样的过程是:
{2,3,4,5,6,6}
{2,3,4,5,5,6}
{2,3,4,4,5,6}
{2,3,3,4,5,6}
{2,2,3,4,5,6}
{1,2,3,4,5,6}

结论: 当需要插入的数是较小的数时,后移的次数明显增多,对效率有影响.

希尔排序法基本思想:
希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至 1 时,整个文件恰被分成一组,算法便终止

示意图
在这里插入图片描述
在这里插入图片描述
代码实现

  1. 希尔排序时, 对有序序列在插入时采用交换法, 并测试排序速度.

通过80000个随机数据测试所花时间大约4720ms,此种方式效率低下

//交换法
public static void shellSort(int[] arr){
	int temp = 0;
	for (int gap = arr.length / 2; gap > 0; gap /= 2) {
		//希尔排序的第一轮排序
		for (int i = gap; i < arr.length; i++) {
			//遍历各组中所有的元素
			for (int j = i - gap; j >= 0; j -= gap) {
				//如果当前元素大于加上步长后的那个元素,说明需要交换
				if(arr[j] > arr[j + gap]){
					temp = arr[j];
					arr[j] = arr[j + gap];
					arr[j + gap] = temp;
				}
			}
		}
	}
}
  1. 希尔排序时, 对有序序列在插入时采用移动法, 并测试排序速度

通过80000个随机数据测试所花时间大约13ms
八百万个随机数据测试所花时间大约1500ms

//移位法 
public static void shellSort(int[] arr){
	int temp = 0;
	int insertVal = 0;
	int insertIndex = 0;
	//增量gap,并逐步的缩小增量
	for (int gap = arr.length / 2; gap > 0; gap /= 2) {
		//从第gap个元素,逐个对其所在的组进行直接插入排序
		for (int i = gap; i < arr.length; i++) {
			insertVal = arr[i];
			insertIndex = i - gap;
			while(insertIndex >= 0 && arr[insertIndex] > insertVal){
				arr[insertIndex + gap] = arr[insertIndex];
				insertIndex -= gap;
			}
			//判断是否需要赋值
			if(insertIndex + gap != i){
				arr[insertIndex + gap] = insertVal;
			}
		}
	}
}

归并排序

归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer) 策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。
在这里插入图片描述
上图中的最后一次合并,要将
[4,5,7,8]和[1,2,3,6]两个已经有序的子序列,合并为最终序列[1,2,3,4,5,6,7,8],来看下实现步骤
在这里插入图片描述
代码实现:
八百万个随机数据测试所花时间大约1050ms

public static void mergeSort(int[] arr, int left, int right, int[] temp){
	if(left < right){
		int mid = (left + right) / 2; //中间索引
		//向左递归进行分解
		mergeSort(arr, left, mid, temp);
		//向右递归进行分解
		mergeSort(arr, mid + 1, right, temp);
		//合并
		merge(arr, left, mid, right, temp);
	}
}
	
 /**
  * 合并的方法
  * @param arr 排序的原始数组
  * @param left 左边有序序列的初始索引
  * @param mid 中间索引
  * @param right 右边索引
  * @param temp 做中转的数组
  */
public static void merge(int[] arr, int left, int mid, int right, int[] temp){
	int i = left; //初始化i,左边有序序列的初始索引
	int j = mid + 1; //初始化j,右边有序序列的初始索引
	int t = 0; //指向temp数组的当前索引
	
	//一、
	//先把左右两边(有序)的数据按照规则填充到temp数组
	//直到左右两边的有序序列,有一边处理完毕为止
	while(i <= mid && j <= right){
		//如果左边的有序序列的当前元素,小于等于右边有序序列的当前元素
		//就将左边的当前元素,拷贝到temp数组中
		if(arr[i] <= arr[j]){
			temp[t] = arr[i];
			t += 1;
			i += 1;
		}else{//反之,将右边有序序列的当前元素,填充到tmep数组
			temp[t] = arr[j];
			t += 1;
			j += 1;
		}
	}
	
	//二、
	//把有剩余数据的一边的数据依次全部填充到temp
	while(i <= mid) {//左边有序序列还有剩余的元素,就全部填充到tmep
		temp[t] = arr[i];
		t += 1;
		i += 1;
	}
	while(j <= right) {//右边有序序列还有剩余的元素,就全部填充到tmep
		temp[t] = arr[j];
		t += 1;
		j += 1;
	}
	
	
	//三、
	//将temp数组的元素拷贝到arr
	//注意:并不是每一次都拷贝所有
	t = 0;
	int tempLeft = left;
	while(tempLeft <= right){
		arr[tempLeft] = temp[t];
		tempLeft += 1;
		t += 1;
	}
}

在这里插入图片描述

基数排序 (桶排序)

介绍

  1. 基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或 bin sort,顾名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用
  2. 基数排序法是属于稳定性的排序,基数排序法是效率高的稳定性排序法
  3. 基数排序(Radix Sort)是桶排序的扩展
  4. 基数排序是 1887 年赫尔曼·何乐礼发明的。它是这样实现的:将整数按位数切割成不同的数字,然后按每个位数分别比较。

基本思想
将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
代码实现
八百万个随机数据测试所花时间大约425ms

//基数排序方法
public static void radixSort(int[] arr){
	
	int max = 0;
	for (int i = 0; i < arr.length; i++) {
		if(arr[i] > max){
			max = arr[i];
		}
	}
	int maxLength = (max + "").length();
	
	//定义一个二维数组,表示10个桶,每个桶就是一个一维数组
	//说明
	//1.二维数组包含10个一维数组
	//2.为了防止在放入数的时候,数据溢出,则每个一维数组(桶),大小定为arr.length
	//3.基数排序是使用空间换时间的经典算法
	int[][] bucket = new int[10][arr.length];
	
	//为了记录每个桶中,实际存放了多少个数据,需要定义一个一维数组来记录每个桶每次放入的数据个数
	//比如:bucketElementCounts[0] 记录的就是 bucket[0] 桶放入的数据个数
	int[] bucketElementCounts = new int[10];
		
	for (int i = 0, n = 1; i < maxLength; i++, n *= 10) {
		for (int j = 0; j < arr.length; j++) {
			//取出每个元素的个位数
			int digitOfElement = arr[j] / n % 10;
			//放入到对应的桶中
			bucket[digitOfElement][bucketElementCounts[digitOfElement]] = arr[j];
			bucketElementCounts[digitOfElement]++;
		}
		//按照桶的顺序(一维数组的下标依次取出数据,放入原来数组)
		int index = 0;
		//遍历每一个桶,并将桶中数据,放入到原数组
		for (int k = 0; k < bucketElementCounts.length; k++) {
			//如果桶中有数据,才放入原数组
			if(bucketElementCounts[k] != 0){
				//循环该桶
				for (int l = 0; l < bucketElementCounts[k]; l++) {
					//取出元素放入到arr
					arr[index++] = bucket[k][l];
				}
			}
			//每一轮处理后,需要将每个bucketElementCounts[i] = 0
			bucketElementCounts[k] = 0;
		}
	}
}

时间复杂度和空间复杂度

时间复杂度

  1. 一般情况下,算法中的基本操作语句的重复执行次数是问题规模 n 的某个函数,用 T(n)表示,若有某个辅助函数 f(n),使得当 n 趋近于无穷大时,T(n) / f(n) 的极限值为不等于零的常数,则称 f(n)是 T(n)的同数量级函数。记作 T(n)=O( f(n) ),称O( f(n) ) 为算法的渐进时间复杂度,简称时间复杂度。
  2. T(n) 不同,但时间复杂度可能相同。 如:T(n)=n²+7n+6 与 T(n)=3n²+2n+2 它们的 T(n) 不同,但时间复杂度相同,都为 O(n²)。
  3. 计算时间复杂度的方法:
    用常数 1 代替运行时间中的所有加法常数 T(n)=n²+7n+6 => T(n)=n²+7n+1
    修改后的运行次数函数中,只保留最高阶项 T(n)=n²+7n+1 => T(n) = n²
    去除最高阶项的系数 T(n) = n² => T(n) = n² => O(n²)

平均时间复杂度和最坏时间复杂度

  1. 平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间。
  2. 最坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长。

空间复杂度

基本介绍

  1. 类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)定义为该算法所耗费的存储空间,它也是问题规模 n 的函数。
  2. 空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模 n 有关,它随着 n 的增大而增大,当 n 较大时,将占用较多的存储单元,例如快速排序和归并排序算法, 基数排序就属于这种情况
  3. 在做算法分析时,主要讨论的是时间复杂度。从用户使用体验上看,更看重的程序执行的速度。一些缓存产品(redis, memcache)和算法(基数排序)本质就是用空间换时间.
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值