【数据结构】常见八大排序算法（附动图）

阿瑾0618

已于 2024-10-28 20:47:34 修改

阅读量3k

点赞数 34

分类专栏：数据结构算法文章标签：数据结构排序算法算法

于 2024-02-13 21:51:53 首次发布

本文链接：https://blog.csdn.net/Eristic0618/article/details/136101421

版权

数据结构同时被 2 个专栏收录

23 篇文章 3 订阅

订阅专栏

算法

14 篇文章 0 订阅

订阅专栏

一、前言

关于排序，有一些术语，例如算法的稳定/不稳定，内排序和外排序等，需要我们了解一下

稳定：当未排序时a在b前面且a=b，排序后a仍然在b前面

不稳定：当未排序时a在b前面且a=b，排序后a可能会出现在b后面

内排序：数据记录在内存中进行排序

外排序：由于数据太大，在排序过程中需要访问外存

二、冒泡排序

冒泡排序的效率十分低下，但是胜在排序过程形象易懂，适用于教学使用。

通过对数列的遍历并比较相邻的元素，将目标元素逐步移动到数组的尾端，就像泡泡慢慢冒出水面，因此得名。

2.1 算法描述

（1）从头到尾比较相邻元素，如果第一个大于第二个（升序）就将二者交换位置

（2）重复n-1遍第一步（最后一个元素一定是最小的所以不用排了）

2.2 动图展示

2.3 代码实现

void BubbleSort(int* a, int n) //冒泡排序
{
	for (int i = 0; i < n - 1; i++) //重复n-1次
	{
		for (int j = 1; j < n - i; j++) //单趟冒泡排序
		{
			if (a[j - 1] > a[j])
			{
				int tmp = a[j]; //交换元素
                a[j] = a[j - 1];
                a[j - 1] = tmp;
			}
		}
	}
}

2.4 算法优化

如果遍历一遍数组后没有发生任何元素交换，说明数组已经有序，排序就可以结束了。

优化后的代码如下：

void BubbleSort(int* a, int n) //冒泡排序
{
	for (int i = 0; i < n; i++)
	{
		bool flag = false; //flag每次循环重置为false
		for (int j = 1; j < n - i; j++)
		{
			if (a[j - 1] > a[j])
			{
				int tmp = a[j];
                a[j] = a[j - 1];
                a[j - 1] = tmp;
				flag = true; //如果发生元素交换，flag赋值为true
			}
		}
		if (flag == false) //如果单趟冒泡后flag没有发生改变说明已经有序
			break;
	}
}

三、选择排序

选择排序是表现最稳定的算法之一，但它的效率也很低下，无论情况的好与坏它的时间复杂度都是O(n2)。

3.1 算法描述

（1）遍历未排序的部分找出最小值（升序），将其与未排序部分的第一个元素交换

（2）重复n-1遍第一步（最后一个元素一定是最大的所以不用排了）

3.2 动图展示

3.3 代码实现（优化版）

上面的动图中每次遍历只寻找最小值，我们可以优化一下，每次遍历同时寻找最大值和最小值。

void SelectSort(int* a, int n) //选择排序
{
	int begin = 0, end = n - 1;
	int tmp = 0;
	while (begin < end)
	{
		int min = begin;
		int max = begin;
		for (int i = begin; i <= end; i++) //遍历寻找最大和最小值
		{
			if (a[i] > a[max])
				max = i; //保存最大值的下标
			if (a[i] < a[min])
				min = i; //保存最小值的下标
		}
		tmp = a[begin]; //将最小值交换到前面
		a[begin] = a[min];
		a[min] = tmp;
		if (max == begin) 
		{
            //最大值如果恰好在begin处，通过交换就到了min的位置，需要更新下标
			max = min;
		}
		tmp = a[end]; //将最大值交换到后面
		a[end] = a[max];
		a[max] = tmp;
		begin++; //更新头部位置
		end--; //更新尾部位置
	}
}

四、插入排序

插入排序的逻辑十分简单，将待排序的元素一个个插入到一个已经排好序的有序数列中，直到整个数列都有序为止。

过年的时候我们打扑克牌，将一堆无序的牌变得有序的过程实际上就是运用了插入排序的思想。

4.1 算法描述

（1）只有一个元素时默认有序，所以我们跳过第一个元素

（2）取出下一个元素，在已经排好序的序列中从后向前扫描并与取出的元素对比

（3）如果扫描到的元素大于取出的元素（升序），就将扫描的元素向后移一位

（4）重复步骤3，直到扫描到的元素小于或等于取出的元素，将取出的元素放入有序数列

（5）重复步骤2~5

4.2 动图展示

4.3 代码实现

void InsertSort(int* a, int n) //插入排序
{
	for (int i = 1; i < n; i++)
	{
		int end = i - 1; //有序序列的尾部位置
		int tmp = a[i]; //取出待排序元素
		while (end >= 0) //扫描有序序列
		{
			if (tmp < a[end]) //扫描到的元素大于取出的元素
			{
				a[end + 1] = a[end]; //将其向后移一位
				end--; //从后向前扫描
			}
			else //找到合适的位置
			{
				break;
			}
		}
		a[end + 1] = tmp; //将取出的元素插入
	}
}

五、希尔排序

希尔排序又称缩小增量排序，它也是插入排序的一种，由希尔（Donald Shell）于1959年提出，也是时间复杂度冲破O(n2)的第一批算法之一。

5.1 算法描述

（1）设定一个gap，并按照gap将待排序数列分割成若干子序列，对子序列分别进行插入排序

（2）将gap缩小，重复步骤1，当gap=1时就是插入排序

5.2 动图展示

5.3 代码实现

void ShellSort(int* a, int n) //希尔排序
{
	int gap = n;
	while (gap > 1)
	{
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; i++)
		{
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (a[end] > tmp)
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
					break;
			}
			a[end + gap] = tmp;
		}
	}
}

希尔排序是对插入排序的优化，当gap>1时都是预排序，目的是让数组不断趋近有序；当gap为1时数组已经很接近有序了，所以排起来就会很快。

六、堆排序

堆排序（Heapsort）是指利用堆积树（堆）这种数据结构所设计的一种排序算法，是选择排序的一种，通过堆来进行选择数据。

在前面学习数据结构堆的时候我们已经见过堆排序了，这里不再赘述。

6.1 算法描述

（1）先建堆，升序建大堆，降序建小堆

（2）将堆顶元素与堆尾元素互换，并排除出堆

（3）此时堆的性质被打破，通过向下调整算法调整为新的堆，重复操作2直至序列有序

6.2 动图展示

6.3 代码实现

typedef int HPDataType;

typedef struct Heap
{
	HPDataType* arr;
	int size;
	int capacity;
}Heap;

void AdjustDown(int* a, int n, int root) //向下调整算法
{
	int child = root * 2 + 1;
	while (child < n)
	{
		if (child + 1 < n && a[child + 1] > a[child])
		{
			child = child + 1;
		}
		if (a[child] > a[root])
		{
			HPDataType tmp = a[child];
			a[child] = a[root];
			a[root] = tmp;
			root = child;
			child = root * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

void HeapSort(int* a, int n) //堆排序
{
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(a, n, i); //通过向下调整算法建堆
	}
	while (n > 1)
	{
		int tmp = a[0]; //将堆顶元素交换到堆尾
        a[0] = a[n - 1];
        a[n - 1] = tmp;
		n--; //排除原堆顶元素
		AdjustDown(a, n, 0); //调整被打乱的堆
	}
}

七、快速排序

快速排序是本文的重头戏，它是对冒泡排序的一种改进算法，在当前所有的内部排序算法中，快速排序被认为是最好的排序算法之一。

7.1 算法描述

（1）任选待排序序列中的某元素作为基准值，按照该值通过单趟排序将待排序的序列分为左右两个子序列，左子序列中的元素均小于基准值，右子序列中的元素均大于基准值（升序）

（2）分别对左右两个子序列重复步骤1，直至序列有序

7.2 单趟排序的实现

不同版本的快排核心思想都是一样的，区别在于单趟排序的方式不同

7.2.1 hoare版本

大体思路

（1）选定待排序序列头部（或尾部）的元素作为key值，保存下标

（2）扫描待排序序列，一个从左到右寻找比key大的值，另一个从右向左寻找比key小的值，找到后将二者交换。

（3）当待排序序列扫描结束后，将序列头部的key与left位置处的元素交换，并返回left（此时left是key值的下标）

动图展示

代码实现

int PartSort(int* a, int left, int right) //单趟排序hoare版本
{
    //left从待排序序列头部向后走，right从待排序序列尾部向前走

	int key = left; //将待排序序列的第一个元素作为key值
	while (left < right) //left小于right说明单趟排序没结束
	{
		while (left < right && a[right] >= a[key]) //right位置的值不比key小时向前走
		{
			right--;
		}
		while (left < right && a[left] <= a[key]) //left位置的值不比key大时向后走
		{
			left++;
		}
		tmp = a[left]; //此时right位置的值比key小，left位置的值比key大
		a[left] = a[right]; //二者交换
		a[right] = tmp;
	}
	tmp = a[key]; //把序列头部作为key值的元素交换到left位置，完成单趟排序
	a[key] = a[left];
	a[left] = tmp;
	return left; //返回left位置存放的key值
}

7.2.2 挖坑法

大体思路

（1）将待排序序列头部的元素存放到一个临时变量中作为key值，将key值原先的位置作为坑位

（2）从右往左寻找比key小的值，找到后将其填入坑中，并且其原来的位置成为新的坑

（3）从左往右寻找比key大的值，找到后将其填入坑中，并且其原来的位置成为新的坑

（4）重复步骤2~3直到待排序序列扫描完毕

（5）最后将key值填入坑中，返回key值下标

动图展示

代码实现

int PartSort(int* a, int left, int right) //单趟排序挖坑法
{
	int tmp = a[left];
	int hole = left;
	while (left < right)
	{
		while (left < right && a[right] >= tmp)
		{
			right--;
		}
		a[hole] = a[right];
		hole = right;
		while (left < right && a[left] <= tmp)
		{
			left++;
		}
		a[hole] = a[left];
		hole = left;
	}
	a[hole] = tmp;
	return left;
}

7.2.3 前后指针法

大体思路

（1）prev指针指向待排序序列开头，cur指针指向prev的下一个位置，将序列头部元素作为key值

（2）cur向后走寻找比key小的值，如果找到则prev++，并交换元素

（3）重复步骤2直到cur走到结尾，将key值与prev位置的值交换并返回key值此时的下标

动图展示

代码实现

int PartSort(int* a, int left, int right) //单趟排序前后指针法
{
	int midi = GetMidIndex(a, left, right);
	Swap(&a[left], &a[midi]);
	int key = left;
	int prev = left;
	int cur = left + 1;
	while (cur < right + 1)
	{
		if (a[cur] < a[key])
		{
			prev++;
			tmp = a[cur];
		    a[cur] = a[prev];
		    a[prev] = tmp;
		}
		cur++;
	}
	tmp = a[key];
	a[key] = a[prev];
	a[prev] = tmp;
	return prev;
}

7.3 递归实现快排

快排是一种二叉树结构的交换排序算法，因此我们可以用递归实现。

用递归实现快排比较简单，这里直接放代码

void QuickSort(int* a, int left, int right) //递归实现快排
{
	if (left >= right)
		return;
	int key = PartSort(a, left, right);
	QuickSort(a, left, key - 1);
	QuickSort(a, key + 1, right);
}

7.4 非递归实现快排

非递归的方式需要用到栈，通过对待排序区间下标的压栈和出栈来实现快排

大体思路

（1）首先将待排序序列尾部的下标压入栈中，再将头部的下标压入栈中（因为后面出栈要先取出头部再取出尾部，栈的特性是后进先出）

（2）取两次栈顶元素，分别取出序列头部和尾部的下标，对这一区间进行单趟排序后获取key值的下标

（3）当key值不与原区间头部或尾部相邻时，以key值为分界将先前的区间拆分成两部分，分别压入栈中

（4）重复步骤2~3直到栈为空

代码实现

void QuickSortNonR(int* a, int left, int right) //非递归实现快排
{
	Stack st;
	StackInit(&st);
	StackPush(&st, right);
	StackPush(&st, left);
	while (!StackEmpty(&st))
	{
		int begin = StackTop(&st);
		StackPop(&st);
		int end = StackTop(&st);
		StackPop(&st);
		int keyi = PartSort2(a, begin, end);
		if (keyi + 1 < end)
		{
			StackPush(&st, end);
			StackPush(&st, keyi + 1);
		}
		if (begin < keyi - 1)
		{
			StackPush(&st, keyi - 1);
			StackPush(&st, begin);
		}
	}
}

具体关于栈的实现可以前往数据结构——栈-CSDN博客查看

7.5 算法优化

（1）三数取中法

快速排序虽然效率高，但是还是有缺陷的。

当快排在排序大量有序或者接近有序的序列时，选择的key容易恰好为最小值，效率比较低下，会进行一些不必要的递归。

当递归调用层数过深，会导致栈溢出的情况，这里我们可以使用三数取中的办法来对这种情况进行优化。

三数取中，就是对比待排序序列头部的值、中部的值和尾部的值，选出三者中既不是最大也不是最小的值作为key值，并放到序列头部

其代码实现如下：

int GetMidIndex(int* a, int left, int right)//三数取中
{
	int mid = (left + right) / 2;
	if (a[left] > a[mid])
	{
		if (a[mid] > a[right])
			return mid;
		else if (a[left] > a[right])
			return right;
		else
			return left;
	}
	else
	{
		if (a[mid] < a[right])
			return mid;
		else if (a[left] < a[right])
			return right;
		else
			return left;
	}
}

具体的使用，我们只需要在单趟排序代码的开头加上这么一段就行：

int midi = GetMidIndex(a, left, right);
tmp = a[left];
a[left] = a[midi];
a[midi] = tmp;

（2）小区间优化

快排在排序一个数据量为100万的无序序列时只需要递归20层，但排序一个8个数据的无序序列时就要递归3层。

在递归出的二叉树结构中，最底部的三层的递归次数竟然占用了全部递归次数的87.5%！

因此我们可以对递归实现快排的代码进行优化，当区间的数据量较小时，转为使用其他的排序算法

本质上是为了减少递归调用次数来提高效率

这里我们可以使用插入排序来排序数据量较小的区间

void QuickSort(int* a, int left, int right) //小区间优化版快排
{
	if (left >= right)
		return;
	if (right - left + 1 < 10)
	{
		InsertSort(a + left, right - left + 1);
		return;
	}
	int key = PartSort2(a, left, right);
	QuickSort(a, left, key - 1);
	QuickSort(a, key + 1, right);
}

小区间优化的思想对递归实现归并排序也tong'yang'sh

（3）三路划分

虽然三数取中法能解决待排序序列有序或接近有序的情况，但是如果序列中有大量的元素和key相等，甚至整个序列所有元素都相等时，三数取中也无法解决这种情况

这时需要使用三路划分的思想

三路划分的大体思路：

（1）begin指向区间头部，cur指向begin的下一个位置，end指向区间尾部，以头部元素作为key

（2）如果cur处的值小于key，则将begin和cur处的元素交换，二者各向后一步

（3）如果cur处的值等于key，则cur向后走一步

（4）如果cur处的值大于key，则将cur和end处的元素交换，cur向前走一步

（5）重复以上步骤直到cur > end时结束

（6）对左边小于key的部分和右边大于key的部分进行递归

三路划分的代码实现：

void QuickSortThreeWay(int* a, int left, int right)//三路划分版快排
{
	if (left >= right)
		return;
	int begin = left;
	int end = right;
	int cur = begin + 1;
	int key = a[left];
	while (cur <= end)
	{
		if (a[cur] < key)
		{
			Swap(&a[cur], &a[begin]);
			cur++;
			begin++;
		}
		else if (a[cur] > key)
		{
			Swap(&a[cur], &a[end]);
			end--;
		}
		else
		{
			cur++;
		}
	}
	QuickSort(a, left, begin - 1);
	QuickSort(a, end + 1, right);
}

八、归并排序

归并排序的核心思想：分治

分治就是将一个复杂的问题分解成子问题，子问题再分解成更小子问题，直到最后子问题可以简单求解。在求二叉树的节点个数和二叉树的高度时我们也使用过这个思想。

将待排序的序列分解为两个子序列，再将子序列继续分解，直到每个子序列中只有一个元素，此时默认有序。再将有序的子序列逐渐归并到一起。

若将两个有序子序列合并成一个序列，称为二路归并。归并排序的逻辑图如下：

8.1 算法描述

（1）malloc一块和待排序序列大小相同的空间，用来临时存放归并后的序列

（2）通过递归或迭代将待排序序列拆分多个子序列

（3）子序列间两两归并到开辟出的空间中，具体操作可以参考两个有序数组合并

（4）将归并后的子序列用memcpy覆盖到原序列中

（5）重复上述操作直到序列有序

8.2 动图展示

8.3 递归实现归并排序

大体思路

（1）通过递归将待排序序列不断的对半分，直到分出的子序列中只有一个元素

（2）计算出相邻两个子序列区间的边界，对二者进行归并

代码实现

我们不能每次递归都开辟一次空间，所以需要将主要的代码都放在子函数中，对子函数进行递归

//递归实现归并排序
void _MergeSort(int* a, int begin, int end, int* tmp)
{
	if (begin == end)
		return;
	int midi = (begin + end) / 2;
	_MergeSort(a, begin, midi, tmp);
	_MergeSort(a, midi + 1, end, tmp);
	int begin1 = begin, end1 = midi;
	int begin2 = midi + 1, end2 = end;
	int i = begin;
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (a[begin1] < a[begin2])
		{
			tmp[i++] = a[begin1++];
		}
		else
		{
			tmp[i++] = a[begin2++];
		}
	}
	while (begin1 <= end1)
	{
		tmp[i++] = a[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[i++] = a[begin2++];
	}
	memcpy(a + begin, tmp + begin, sizeof(int) * (end - begin + 1));
}


void MergeSort(int* a, int n)
{
	int* tmp = malloc(sizeof(int) * n);
	_MergeSort(a, 0, n - 1, tmp);
	free(tmp);
}

8.4 非递归实现归并排序

通过非递归来实现归并排序，最难解决的是边界问题

大体思路

（1）设定一个初始值为1的gap

（2）通过gap来分割子序列。每次分割出两个相邻的子序列进行归并，归并好一组就将其覆盖到原序列中

（3）重复步骤2直到第一轮归并结束

（4）gap乘2，重复步骤2~3，直到gap超过原序列的大小

对于边界问题，在分割子序列的时候可能会出现以下问题：

①两个子序列都越界

②只有第二个子序列越界

当相邻的两个子序列都越界时，我们就不对它们进行归并了，放在原序列中就好

当只有第二个子序列越界时，我们对越界的序列右侧进行修正即可

代码实现

//非递归实现归并排序
void MergeSortNonR(int* a, int n)
{
	int* tmp = malloc(sizeof(int) * n);
	int gap = 1;
	while (gap < n)
	{
		for (int i = 0; i < n; i += 2 * gap)
		{
			int begin1 = i, end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + 2 * gap - 1;
			int j = i;
			if (end1 >= n || begin2 >= n)
			{
				break;
			}
			if (end2 >= n)
			{
				end2 = n - 1;
			}
			while (begin1 <= end1 && begin2 <= end2)
			{
				if (a[begin1] < a[begin2])
				{
					tmp[j++] = a[begin1++];
				}
				else
				{
					tmp[j++] = a[begin2++];
				}
			}
			while (begin1 <= end1)
			{
				tmp[j++] = a[begin1++];
			}
			while (begin2 <= end2)
			{
				tmp[j++] = a[begin2++];
			}
			memcpy(a + i, tmp + i, sizeof(int) * (end2 - i + 1));
		}
		gap *= 2;
	}
	free(tmp);
}

九、计数排序

计数排序是一个不基于比较的排序算法，又被称为鸽巢原理，是对哈希直接定址法的变形应用。

其优势在于对一定范围内较集中的序列排序时，其时间复杂度低于任何一个基于比较的算法。

其劣势在于是一种用空间换时间的算法，依赖数据范围，只适用于范围较集中的整型数组。

9.1 算法描述

核心思想：统计待排序序列中每种元素出现的次数，按照顺序和出现的次数依次放入原序列中

（1）首先遍历待排序序列找出最大值和最小值，算出序列元素的范围大小

（2）按照算出的范围开辟一块空间，用来存放统计出的元素个数

因为序列中元素的范围不一定从0开始，如果使用绝对映射（以元素的真实数值作为下标）就会浪费大量空间。当我们找出最大值和最小值后，将元素减去最小值就是它的相对位置

（3）遍历待排序序列，对每种元素出现的次数进行统计

（4）根据统计的结果，按照顺序放入原序列

9.2 动图展示

9.3 代码实现

void CountSort(int* a, int n) //计数排序
{
	int max = a[0], min = a[0];
	for (int i = 0; i < n; i++)
	{
		if (a[i] > max)
		{
			max = a[i];
		}
		if (a[i] < min)
		{
			min = a[i];
		}
	}
	int range = max - min + 1;
	int* tmp = (int*)malloc(sizeof(int) * range);
	memset(tmp, 0, sizeof(int) * range);
	for (int i = 0; i < n; i++)
	{
		tmp[a[i] - min]++;
	}
	int k = 0;
	for (int i = 0; i < range; i++)
	{
		while (tmp[i]--)
		{
			a[k++] = i + min;
		}
	}
}

十、测试环节

既然写了这么多排序算法，不来比个赛多少有点可惜了

通过下面这段代码，我们来测试一下以上八种排序算法

void TestOP()
{
	srand(time(0));
	const int N = 100000;
	int* a1 = (int*)malloc(sizeof(int) * N);
	int* a2 = (int*)malloc(sizeof(int) * N);
	int* a3 = (int*)malloc(sizeof(int) * N);
	int* a4 = (int*)malloc(sizeof(int) * N);
	int* a5 = (int*)malloc(sizeof(int) * N);
	int* a6 = (int*)malloc(sizeof(int) * N);
	int* a7 = (int*)malloc(sizeof(int) * N);
	int* a8 = (int*)malloc(sizeof(int) * N);

	for (int i = 0; i < N; ++i)
	{
		a1[i] = rand();
		a2[i] = a1[i];
		a3[i] = a1[i];
		a4[i] = a1[i];
		a5[i] = a1[i];
		a6[i] = a1[i];
		a7[i] = a1[i];
		a8[i] = a1[i];
	}

	int begin1 = clock();
	InsertSort(a1, N);
	int end1 = clock();

	int begin2 = clock();
	ShellSort(a2, N);
	int end2 = clock();

	int begin3 = clock();
	SelectSort(a3, N);
	int end3 = clock();

	int begin4 = clock();
	HeapSort(a4, N);
	int end4 = clock();

	int begin5 = clock();
	QuickSort(a5, 0, N - 1);
	int end5 = clock();

	int begin6 = clock();
	MergeSort(a6, N);
	int end6 = clock();

	int begin7 = clock();
	BubbleSort(a7, N);
	int end7 = clock();

	int begin8 = clock();
	CountSort(a8, N);
	int end8 = clock();

	printf("InsertSort:%d\n", end1 - begin1);
	printf("ShellSort:%d\n", end2 - begin2);
	printf("SelectSort:%d\n", end3 - begin3);
	printf("HeapSort:%d\n", end4 - begin4);
	printf("QuickSort:%d\n", end5 - begin5);
	printf("MergeSort:%d\n", end6 - begin6);
	printf("BubbleSort:%d\n", end7 - begin7);
	printf("CountSort:%d\n", end8 - begin8);

	free(a1);
	free(a2);
	free(a3);
	free(a4);
	free(a5);
	free(a6);
	free(a7);
	free(a8);
}

这是10万个数据的测试结果