数据结构初阶——排序

zhh601

已于 2022-12-23 21:22:36 修改

阅读量179

点赞数

分类专栏： C语言数据结构文章标签：数据结构

于 2022-12-23 21:22:00 首次发布

本文链接：https://blog.csdn.net/weixin_45138295/article/details/128346301

版权

C语言同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

数据结构

18 篇文章 0 订阅

订阅专栏

本文我们讲解数据结构中与排序有关的内容。

排序的概念及其应用

排序的概念

排序：所谓排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。
稳定性：假定在待排序的记录序列中，存在多个具有相同的关键字的记录，若经过排序，这些记录的相对次序保持不变，即在原序列中，r[i]=r[j]，且r[i]在r[j]之前，而在排序后的序列中，r[i]仍在r[j]之前，则称这种排序算法是稳定的；否则称为不稳定的。
内部排序：数据元素全部放在内存中的排序。
外部排序：数据元素太多不能同时放在内存中，根据排序过程的要求不能在内外存之间移动数据的排序

常见的排序算法

在文章接下来就会介绍下图中的各种算法：

常见排序算法的实现

直接插入排序

当插入第i(i>=1)个元素时，前面的array[0],array[1],…,array[i-1]已经排好序，此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较，找到插入位置即将array[i]插入，原来位置上的元素顺序后移。

图形演示：

代码实现：

//插入排序
void InsertSort(int* a, int n)
{
	for (int i = 0; i < n - 1; i++)
	{
		int end = i;
		int tmp = a[end + 1];
		while (end >= 0)
		{
			if (tmp < a[end])
			{
				a[end + 1] = a[end];
				end--;
			}
			else
			{
				break;
			}
			a[end + 1] = tmp;
		}
	}
}

特性总结：

1. 元素集合越接近有序，直接插入排序算法的时间效率越高
2. 时间复杂度：O(N^2)
3. 空间复杂度：O(1)，它是一种稳定的排序算法
4. 稳定性：稳定（相同元素的相对位置可以不发生改变）

希尔排序( 缩小增量排序 )

希尔排序法又称缩小增量法。希尔排序法的基本思想是：先选定一个整数，把待排序文件中所有记录分成个组，所有距离为的记录分在同一组内，并对每一组内的记录进行排序。然后，取，重复上述分组和排序的工作。当到达=1时，所有记录在统一组内排好序。

希尔排序的思想简单来说就是，先进行分组预排序，然后在gap = 1的时候进行插入排序。

图形演示：

代码实现：

// 希尔排序
void ShellSort(int* a, int n)
{
	int gap = n;
	while (gap > 1)
	{
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; i++)
		{
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (tmp < a[end])
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
					break;
				}
				a[end + gap] = tmp;
			}
		}
	}
}

选择排序

图形演示：

代码实现：

// 选择排序
void SelectSort(int* a, int n)
{
	int begin = 0;
	int end = n - 1;
	int Maxi = begin;
	int Mini = begin;

	while (begin < end)
	{
		for (int i = begin + 1; i <= end; i++)
		{
			if (a[Maxi] < a[i])
			{
				Maxi = i;
			}
			if (a[Mini] > a[i])
			{
				Mini = i;
			}
		}
 		Swap(&a[begin], &a[Mini]);
		if (Maxi == begin)
			Maxi = Mini;
		Swap(&a[end], &a[Maxi]);
		begin++;
		end--;
	}
}

堆排序

图形演示：

在使用堆排序时需要注意，在向下调整的时候堆的右节点时可能是不存在的要添加判断的条件。

代码实现：

// 向下调整，最后形成大堆
void AdjustDwon(int* a, int n, int root)
{
	int child = root * 2 + 1;

	while (child < n)
	{
		if ((child + 1 < n) && (a[child + 1] > a[child]))
		{
			child++;
		}

		if (a[child] > a[root])
		{
			//交换数据
			Swap(&a[child], &a[root]);
			//迭代祖孙
			root = child;
			child = root * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

// 堆排序
void HeapSort(int* a, int n)
{
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDwon(a, n, i);
	}
	int end = n - 1;
	while (end > 0)
	{
		Swap(&a[0], &a[end]);
		AdjustDwon(a, end--, 0);
	}
}

冒泡排序

图形演示：

代码实现：

// 冒泡排序
void BubbleSort(int* a, int n)
{
	for (int i = 0; i < n; i++)
	{
		for (int j = 1; j < n - i; j++)
		{
			if (a[j-1] > a[j])
			{
				Swap(&a[j-1], &a[j]);
			}
		}
	}
}

快速排序（递归版）

快速排序的思想就是，先确定Keyi值得位置，然后在对Keyi的左右子区间进行同样的操作，最后可以得到排序后的结果。

单次排序（hoare版本）图形演示：

单次排序（hoare版本）代码实现：

// 快速排序hoare版本
int PartSort1(int* a, int begin, int end)
{
	int mid = FindMidNum(a, begin, end);
	Swap(&a[mid], &a[begin]);
	/*int keyi = begin;*/

	int left = begin;
	int right = end;
	int keyi = left;
	while (left < right)
	{
		while ((left < right) && (a[right] >= a[keyi]))
		{
			right--;
		}

		while ((left < right) && (a[left] <= a[keyi]))
		{
			left++;
		}

		Swap(&a[left], &a[right]);
	}

	Swap(&a[keyi], &a[left]);
	keyi = left;

	return keyi;
}

在hoare的这个版本之中，我们需要注意在进行移动寻找时需要先启动Right，进行寻找；然后再启动Left。在寻找的同时需要时刻注意Left的数值需要小于Right。

单次排序（挖坑版）图形演示：

单次排序（挖坑版）代码实现：

// 挖坑法
int PartSort2(int* a, int begin, int end)
{
	int mid = FindMidNum(a, begin, end);
	Swap(&a[mid], &a[begin]);

	int left = begin;
	int right = end;
	int hole = begin;
	int key = a[begin];

	while (left < right)
	{
		//右边找小，填到左边的坑里
		while (left < right && a[right] > key)
		{
			--right;
		}
		a[hole] = a[right];
		hole = right;

		//左边找大，填到右边的坑里
		while (left < right && a[left] < key)
		{
			++left;
		}
		Swap(&a[hole], &a[left]);
		hole = left;
	}
	a[hole] = key;
	return hole;
}

单次排序（双指针法）图形演示：

单次排序（双指针法）代码实现：

// 双指针法
int PartSort3(int* a, int begin, int end)
{
	int mid = FindMidNum(a, begin, end);
	Swap(&a[mid], &a[begin]);
	
	int prev = begin;
	int cur = begin + 1;
	int keyi = begin;

	while (cur <= end)
	{
		//找到比k小的值跟++prev进行交换，小的往前翻，大的往后翻
		//if (a[cur] < a[keyi] && ++prev != cur)
		//	Swap(&a[prev], &a[cur]);

		if (a[cur] < a[keyi])
		{
			Swap(&a[++prev], &a[cur]);
		}
		++cur;
	}

	Swap(&a[prev], &a[keyi]);
	keyi = prev;
	return keyi;
}

快速排序全部代码（递归实现）：

void QuickSort(int* a, int begin, int end)
{
	if (begin >= end)
	{
		return;
	}

	if ((end - begin + 1) < 15)
	{
		InsertSort(a + begin, end - begin + 1);
	}

	else
	{
		int keyi = PartSort2(a, begin, end);

		QuickSort(a, begin, keyi - 1);
		QuickSort(a, keyi + 1, end);
	}
}

快速排序（非递归版）

在这里实现快速排序的非递归版，我们使用的是栈这种数据结构。

快速排序（非递归版）图形演示：

根据上图所示，快速排序的非递归版本的过程与递归是类似的，首先将整个数组进行排序，然后对其keyi值左端的数组以及keyi值右端的数组进行排序。我们需要使用栈来记录下每次排序时数组的最左端与最右端的值。

快速排序（非递归版）代码实现：

// 快排非递归
void QuickSortNonR(int* a, int begin, int end)
{
	Stack st;
	StackInit(&st);

	StackPush(&st, begin);
	StackPush(&st, end);

	while (!StackEmpty(&st))
	{
		int right = StackTop(&st);
		StackPop(&st);
		int left = StackTop(&st);
		StackPop(&st);
		int keyi = PartSort3(a, left, right);
		
		if (keyi - 1 > left)
		{
			StackPush(&st, left);
			StackPush(&st, keyi - 1);
		}

		if (right > keyi + 1)
		{
			StackPush(&st, keyi + 1);
			StackPush(&st, right);
		}
	}
	StackDestroy(&st);
}

快排的会遇到的一些问题及优化：

在使用快速排序的时候，我们希望的是我们寻找的keyi值要尽量处在中间的位置，这样我们就可以在理想的情况下以O（N*logN）的时间复杂度来进行排序。但是显示往往不是这样，很有可能我们选到的数是最大的或者是最小的，那么快速排序的时间复杂度就会变为O（N^2）。反而效率会下降。针对这个问题，解决方案就是采用三数取中的方案。

三数取中：我们在最左端，左右端以及中间的三个位置进行比较，然后取出中间大小的那个数，这样就可以尽量避免发生keyi值取到最大或者最小的情况。

//三数取中
int FindMidNum(int* a, int begin, int end)
{
	int mid = (begin + end) / 2;
	if (a[begin] > a[mid])
	{
		if (a[end] > a[begin])
		{
			return begin;
		}
		else if (a[end] < a[mid])
		{
			return mid;
		}
		else
		{
			return end;
		}
	}
	if (a[begin] < a[mid])
	{
		if (a[end] < a[begin])
		{
			return begin;
		}
		else if (a[end] > a[mid])
		{
			return mid;
		}
		else
		{
			return end;
		}
	}
}

第二种情况是小区间优化，快速排序的整个过程类似于二叉树的样子，当快速排序递归进去的区间比较小时，可以直接使用插入排序进行替换，因为大部分的递归调用都是在小区间的情况下进行的，当我们将小区间进行处理之后，可以大大减少递归次数。

	if ((end - begin + 1) < 15)
	{
		InsertSort(a + begin, end - begin + 1);
	}

归并排序

基本思想：
归并排序（MERGE-SORT）是建立在归并操作上的一种有效的排序算法,该算法是采用分治法（Divide andConquer）的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为二路归并。

图形演示（递归）：

排序（冒泡排序，选择排序，插入排序，归并排序，快速排序，计数排序，基数排序） - VisuAlgo

自己对于递归进行的图形演示：

代码实现（递归）：

void _MergeSort(int* a, int begin, int end, int* tmp)
{
	if (begin >= end)
	{
		return;
	}
	
	// 去中间的值进行分割
	int mid = (begin + end) / 2;

	// 类似于二叉树后序遍历
	_MergeSort(a, begin, mid, tmp);
	_MergeSort(a, mid + 1, end, tmp);

	// 使用begin1和begin2来记录左右区间的起始位置
	int begin1 = begin, end1 = mid;
	int begin2 = mid + 1, end2 = end;
	int i = begin;

	while (begin1 <= end1 && begin2 <= end2)
	{
		if (a[begin1] <= a[begin2])
		{
			tmp[i++] = a[begin1++];
		}
		else
		{
			tmp[i++] = a[begin2++];
		}
	}

	while (begin1 <= end1)
	{
		tmp[i++] = a[begin1++];
	}

	while (begin2 <= end2)
	{
		tmp[i++] = a[begin2++];
	}

	//将排序好的数组拷贝回原数组
	memcpy(a + begin, tmp + begin, sizeof(int) * (end - begin + 1));
}
// 归并排序递归实现
void MergeSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail");
		exit(-1);
	}

	_MergeSort(a, 0, n - 1, tmp);
	free(tmp);
	tmp = NULL;
}

图形演示（非递归）：

代码实现（非递归）：

// 归并排序非递归实现
void MergeSortNonR(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail");
		exit(-1);
	}

	int rangeN = 1;
	while (rangeN < n)
	{
		for (int j = 0; j < n; j += rangeN * 2)
		{
			int begin1 = j, end1 = j + rangeN - 1;
			int begin2 = j + rangeN, end2 = j + 2 * rangeN - 1;
			int i = j;

			//需要对越界的情况进行判断
			//有两种针对越界的方案
			//1、修正
			//2、跳出
			//不能使用end1 = begin2 = end2 = n-1 来进行修正，会导致问题出现
			if (end1 >= n)
			{
				end1 = n - 1;
				begin2 = n; 
				end2 = n - 1;
			}
			else if (begin2 >= n)
			{
				begin2 = n;
				end2 = n - 1;
			}
			else if (end2 >= n)
			{
				end2 = n - 1;
			}

			while (begin1 <= end1 && begin2 <= end2)
			{
				if (a[begin1] <= a[begin2])
				{
					tmp[i++] = a[begin1++];
				}
				else
				{
					tmp[i++] = a[begin2++];
				}
			}

			while (begin1 <= end1)
			{
				tmp[i++] = a[begin1++];
			}

			while (begin2 <= end2)
			{
				tmp[i++] = a[begin2++];
			}

			//将排序好的数组拷贝回原数组
			memcpy(a + j, tmp + j, sizeof(int) * (end2 - j + 1));
		}
			//将排序好的数组拷贝回原数组
			//若是使用break的方式需要将拷贝整体进行。
			//memcpy(a, tmp, sizeof(int) * (n));
			rangeN *= 2;
	}

	free(tmp);
	tmp = NULL;
}

排序算法复杂度及稳定性

下面我们来看一下各个排序算法的时间复杂度和稳定性。

直接插入排序的特性总结：
1. 元素集合越接近有序，直接插入排序算法的时间效率越高
2. 时间复杂度：O(N^2)
3. 空间复杂度：O(1)，它是一种稳定的排序算法
4. 稳定性：稳定

希尔排序的特性总结：
1. 希尔排序是对直接插入排序的优化。
2. 当gap > 1时都是预排序，目的是让数组更接近于有序。当gap == 1时，数组已经接近有序的了，这样就会很快。这样整体而言，可以达到优化的效果。我们实现后可以进行性能测试的对比。
3. 希尔排序的时间复杂度不好计算，因为gap的取值方法很多，导致很难去计算，因此在好些树中给出的希尔排序的时间复杂度都不固定：暂时可以以O（n^1.25）~O（1.6*n^1.25）

4. 稳定性：不稳定