八大排序算法解析---动图理解

new出对象

已于 2024-05-08 21:29:30 修改

阅读量245

点赞数 11

文章标签： c语言数据结构

于 2022-07-18 16:42:32 首次发布

本文链接：https://blog.csdn.net/qzt__l0ve/article/details/125853205

版权

所谓排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作

一、插入排序

原理：

直接插入排序是一种简单的插入排序法，其基本思想是：把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中，直到所有的记录插入完为止，得到一个新的有序序列。比如我们玩的斗地主，在整理牌时，不就是要按照由大到小或由小到大的顺序排列吗，运用的就是插入排序。

特性：

1. 元素集合越接近有序，直接插入排序算法的时间效率越高
2. 时间复杂度：O(N^2)
3. 空间复杂度：O(1)，它是一种稳定的排序算法
4. 稳定性：稳定

动图演示：

代码实现：

// C语言版
void InserSort(int* a, int n)
{
	for (int i = 0; i < n - 1; i++)
	{
		int end = i;
		int tmp = a[end + 1];
		while (end >= 0)
		{
			if (tmp < a[end])
			{
				a[end + 1] = a[end];
				--end;
			}
			else
				break;
		}
		a[end + 1] = tmp;
	}
}

// C++版
void insertSort(vector<int>& v) {
	int n = v.size();
	for (int i = 1; i < n; i++) {
		int tmp = v[i];
		for (int j = i; j > 0; j--) {
			if (v[j-1] > v[j]) {
				int tmp = v[j];
				v[j] = v[j - 1];
				v[j - 1] = tmp;
			}
			else {
				break;
			}
		}
	}
}

for循环，依次从左往右遍历；while循环，end+1位置上的数与前一个数比较，如果小于前一个数就交换。

二、希尔排序

原理：

希尔排序法的基本思想是：先选定一个整数，把待排序文件中所有记录分成gap个组，所有距离为gap的记录分在同一组内，并对每一组内的记录进行排序。然后，取，重复上述分组和排序的工
作。当到达gap=1时，所有记录在统一组内排好序。

//排升序，gap越大，大的数更快到后面，小的数可以更快的到前面，但是越不接近有序；
//排升序，gap越小，越接近有序的；当gap==1，就是插入排序

特性：

1. 希尔排序是对直接插入排序的优化。
2. 当gap > 1时都是预排序，目的是让数组更接近于有序。当gap == 1时，数组已经接近有序的了，这样就会很快。这样整体而言，可以达到优化的效果。我们实现后可以进行性能测试的对比。
3. 希尔排序的时间复杂度不好计算，因为gap的取值方法很多，导致很难去计算。
4.稳定性：不稳定

演示：

代码实现：

void ShellSort(int* a, int n)
	int gap = n;
	while (gap > 1) {
		gap = gap / 3+1;//+1保证最后一次一定是1

		for (int i = 0; i < n - gap; ++i) {
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (tmp < a[end])
				{
					a[end + gap] = a[end];
					end -= gap;

				}
				else {
					break;
				}
			}
			a[end + gap] = tmp;
		}
	}
}

可以看出希尔排序与插入排序1起始很相像，主要就是多了一个gap，预排序，当gap=1时，就是插入排序了。

三、选择排序

思想：每一次从待排序的数据元素中选出最小（或最大）的一个元素，存放在序列的起始位置，直到全部待排序的数据元素排完。

在元素集合array[i]--array[n-1]中选择关键码最大(小)的数据元素
若它不是这组元素中的最后一个(第一个)元素，则将它与这组元素中的最后一个（第一个）元素交换
在剩余的array[i]--array[n-2]（array[i+1]--array[n-1]）集合中，重复上述步骤，直到集合剩余1个元素

void Swap(int* a, int* b)
{
	int tmp = *a;
	*a = *b;
	*b = tmp;
}
void SelectSort(int* a, int n)
{
	assert(a);
	int begin = 0, end = n - 1;
	while (begin < end)
	{
		int mini = begin, maxi = begin;//mini记录最小元素下标，maxi记录最大元素下标
		for (int i = begin+1; i <= end; i++)//小的元素放左边，大的放右边。
		{
			if (a[i] < a[mini])
			{
				mini = i;
			}
			if (a[i] > a[maxi])
				maxi = i;
		}
		Swap(&a[begin], &a[mini]);
		//如果begin与maxi重叠，那么要修正一下maxi的位置
		if (begin == maxi)
		{
			maxi = mini;
		}
		Swap(&a[end], &a[maxi]);
		++begin;
		--end; 
	}
}

//C++
void selectSort(vector<int>& v) {
	int n = v.size();
	for (int i = 0; i < n; i++) {
		//int tail = v[i];
		for (int j = i + 1; j < n; j++) {
			if (v[i] < v[j]) {
				int tmp = v[j];
				v[j] = v[i];
				v[i] = tmp;
			}
		}
	}
}

左右两边往中间靠，最小的数放最左边，最大的数放最右边（升序）。

特性：
1. 直接选择排序思想非常好理解，但是效率不是很好。实际中很少使用
2. 时间复杂度：O(N^2)
3. 空间复杂度：O(1)
4. 稳定性：不稳定

四、冒泡排序

冒泡排序与快排，都属于交换排序，其思想：就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置，交换排序的特点是：将键值较大的记录向序列的尾部移动，键值较小的记录向序列的前部移动。


void Swap(int* a, int* b)
{
	int tmp = *a;
	*a = *b;
	*b = tmp;
}

void BubbleSort(int* a, int n)
{
	assert(a);
	for (int j = 0; j < n; j++) //这个循环没循环一次，可将0~n-j中最大的元素排到最后
    {
		for (int i = 0; i < n - j; i++)
		{
			if (a[i - 1] > a[i])
			{
				Swap(&a[i - 1], &a[i]);
			}
		}
	}
}

特性：

1. 冒泡排序是一种非常容易理解的排序
2. 时间复杂度：O(N^2)
3. 空间复杂度：O(1)
4. 稳定性：稳定

五、快排

快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法，其基本思想为：任取待排序元素序列中的某元素作为基准值，按照该排序码将待排序集合分割成两子序列，左子序列中所有元素均小于基准值，右子序列中所有元素均大于基准值，然后最左右子序列重复该过程，直到所有元素都排列在相应位置上为止。

（一）递归方式

void QuickSort(int* a, int begin, int end)
{
	//区间不存在
	if (begin >= end)
		return;
    
    //该处有三种方式// 按照基准值对数组中的 [begin, end)区间中的元素进行划分
    int keyi = PartSort1(a, begin, end);//返回一个基准值keyi

    //int keyi = PartSort2(a, begin, end);
	//int keyi = PartSort3(a, begin, end);
	
    //划分后再进行递归
    QuickSort(a, begin, keyi - 1);
	QuickSort(a, keyi + 1, end);
}

将区间按照基准值划分为左右两半部分的常见方式有：

1.hoare版本：

先以最左边第一个元素为基准值，然后右边先走，如果大于基准值就继续走，小于就左边走，等左边走到一个大于可以的元素时，就左右两边元素交换，然后继续右边走，与上相同，直到左边元素下标大于等于右边元素下标就停止，然后再交换这时的左元素与基准值。

int PartSort1(int* a, int begin, int end)
{
	int left = begin, right = end;
	int keyi = left;
	while (left < right)
	{
		//右边先走,找小
		while (left < right && a[right] >= a[keyi])
		{
			--right;
		}
		//左边走找大
		while (left < right && a[left] <= a[keyi])
		{
			++left;
		}
		Swap(&a[left], &a[right]);
	}
//走完后将keyi与left交换，即keyi为基准值
	Swap(&a[keyi], &a[left]);
	keyi = left;
	return keyi;
}

2.挖坑法：

先取最左边元素为坑（key），从右边往左走，如果走到一个元素小于key时就将这个元素填到坑里面，然后小这个元素位置变为一个新坑，再左边往右走，如果元素大于key就填入坑里面，然后该下标位置变为新坑，重复以上操作，若左右两边相遇，就停止走，最后将key填到坑里面。

int PartSort2(int* a, int begin, int end)
{
	int key = a[begin];
	int piti = begin;
	while (begin<end)
	{
		//右边找小填左边
		while (begin<end&&a[end]>=key)
		{
			--end;

		}
        //找到小，填到坑里面，然后坑变为小这一个位置
		a[piti] = a[end];
		piti = end;
		//左边找大，天右边
		while (begin < end && a[begin] <= key)
		{
			++begin;
		}
		a[piti] = a[begin];
		piti = begin;
	}
	a[piti] = key;
	return piti;
}

3. 前后指针法

首先，我们需要根据三数取中法找到中间大小的一个数作为key，然后cur往右先走，当cur走到一个数小于key且prev后一个数不为cur时，prev与cur位置元素就交换，然后cur继续走，直达走出数组范围，再将key与prev元素交换。

int GetMidIndex(int* a, int begin, int end)//三数取中，begin，mid，end三数取中间大小那个数
{
	int mid = (begin + end) / 2;
	if (a[begin] < a[mid])
	{
		if (a[mid] < a[end])
		{
			return mid;
		}
		else if (a[begin] < a[end])
		{
			return end;
		}
		else
			return begin;
	}
	else
	{
		if (a[mid] > a[end])
		{
			return mid;
		}
		else if (a[begin] < a[end])
		{
			return begin;
		}
		else
			return end;
	}
}


int PartSort3(int* a, int begin, int end)
{
	
	int keyi=begin;
	int prev = begin;
	int cur = begin+1;

	int midi = GetMidIndex(a, begin, end);
	Swap(&a[keyi], &a[midi]);

	while (cur <= end)
	{
		if (a[cur] < a[keyi]&&++prev!=cur)
		{
			Swap(&a[prev], &a[cur]); 
		}
		++cur;
	}
	Swap(&a[keyi], &a[prev]);
	keyi = prev;
	return keyi;
}

（二）非递归方式

非递归方式的实现可以借助栈先进后出的特性，模拟递归过程实现

首先需要建立一个栈：

typedef int STDataType;
typedef struct stack
{
	STDataType* a;
	int top;//标识栈顶的位置
	int capacity;
}ST;
void StackInit(ST* ps);//初始化
void StackDestory(ST* ps);//摧毁
void StackPush(ST* ps, STDataType x);//插入数据
void StackPop(ST* ps);//删
STDataType StackTop(ST* ps);//取栈顶元素
bool StackEmpty(ST* ps);//空间容量

void StackInit(ST* ps)
{
	assert(ps);
	ps->a = NULL;
	ps->top = 0;
	ps->capacity = 0;
}
void StackDestory(ST* ps)
{
	free(ps->a);
	ps->a = NULL;
	ps->top = ps->capacity = 0;

}
void StackPush(ST* ps, STDataType x)//插入数据
{
	assert(ps);
	if (ps->top == ps->capacity)
	{
		int newCapacity = ps->capacity == 0 ? 4 : ps->capacity * 2;
		STDataType* tmp = (STDataType*)realloc(ps->a, sizeof(STDataType) * newCapacity);
		if (tmp == NULL)
		{
			printf("realloc fail\n");
			exit(-1);

		}
		ps->a = tmp;
		ps->capacity = newCapacity;
	}
	ps->a[ps->top] = x;
	ps->top++;
}
void StackPop(ST* ps)
{
	assert(ps);
	assert(!StackEmpty(ps));

	 ps->top--;
}
STDataType StackTop(ST* ps)
{
	assert(ps);
	assert(!StackEmpty(ps));
	return ps->a[ps->top - 1];
}
bool StackEmpty(ST* ps)
{
	assert(ps);
	return ps->top == 0;
}


//非递归函数
void QuickSortNonR(int* a, int begin, int end)//非递归
{
	ST st;
	StackInit(&st);//初始化
	StackPush(&st, end)；
	StackPush(&st, begin);
	while (!StackEmpty(&st))
	{
		int left = StackTop(&st);//取栈顶元素
		StackPop(&st);//删除栈顶位置
		int right = StackTop(&st);
		StackPop(&st);
		int keyi = PartSort3(a,left,right);//PartSort1，PartSort2都可以使用
		//栈里面的东西都会拿出来，单趟排序分割，子区间再入栈
        //这里相当于是递归过程
		if (keyi + 1 < right)
		{
			StackPush(&st, right);
			StackPush(&st, keyi+1);
		}
		if (left < keyi - 1)
		{
			StackPush(&st, keyi - 1);
			StackPush(&st, left);
		}
	}
	StackDestory(&st);
}

快排特性：

1. 快速排序整体的综合性能和使用场景都是比较好的，所以才敢叫快速排序

2. 时间复杂度：O(N*logN)

3. 空间复杂度：O(logN)

4. 稳定性：不稳定

六、堆排序

堆排序(Heapsort)是指利用堆积树（堆）这种数据结构所设计的一种排序算法，它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆，排降序建小堆。

void AdjustDown(int* a, int size, int parent)//建大堆
{
	int child = parent * 2 + 1;
	while (child < size)
	{
		if (a[child + 1] < a[child] && child + 1 < size)
		{
			++child;
		}
		if (a[child] < a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}

}

void HeapSort(int* a, int n)
{
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(a, n, i);
	}
	int end = n - 1;
	while (end > 0)
	{
		Swap(&a[0], &a[end]);
		AdjustDown(a, end, 0);
		--end;
	}
}

特性：

1. 堆排序使用堆来选数，效率就高了很多。
2. 时间复杂度：O(N*logN)
3. 空间复杂度：O(1)
4. 稳定性：不稳定

七、归并排序

（一）递归方式

归并排序（MERGE-SORT）是建立在归并操作上的一种有效的排序算法,该算法是采用分治法（Divide andConquer）的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为二路归并。归并排序核心步骤：

将整个数组从中间分为左右两个部分，再将左右两个部分依次划分，直到每个部分都只有一个元素时（递归），就开始比较每一层递归出来的两部分的大小，小的先存入新创建的临时数组，递归完后，就相当于每一部分都比较完了，即排序就完成了。

void _MergeSort(int* a, int begin, int end, int* tmp)
{
	if (begin >= end)
	{
		return;
	}

	int mid = (begin + end) / 2;
	_MergeSort(a, begin, mid, tmp);
	_MergeSort(a, mid+1, end, tmp);
	//归并过程
	int begin1 = begin, end1 = mid;
	int begin2 = mid + 1, end2 = end;
	int i = begin1;
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (a[begin1] < a[begin2])
		{
			tmp[i++] = a[begin1++];
		}
		else
			tmp[i++] = a[begin2++];
	}//未走完区间
	while (begin1 <= end1)
	{
		tmp[i++] = a[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[i++] = a[begin2++];
	}
	//把归并数据拷贝回原数组
	memcpy(a + begin, tmp + begin, (end - begin + 1) * sizeof(int));
}
void MergeSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		printf("malloc Fail\n");
		exit(-1);
	}
	_MergeSort(a, 0, n - 1, tmp);
	free(tmp);
}

（二）非递归方式

使用分治算法：大问题分解小问题，小问题再进一步的分解，直到不可再分解的子问题。

我们可以将一段无序序列不断分解，分解到只剩下两个数的子序列。这时候这两个数就可以看做是两个有序的子序列，从而可以采用归并算法对这两个数进行排序。排过序的序列又成为了新的有序子序列，继续往上排序，直到将原序列分成两个有序的子序列再归并就能完成整个排序的过程了。

void MergeSortNonR(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		printf("malloc fail\n");
		exit(-1);
	}
	int gap = 1;
	while (gap<n) {
		for (int i = 0; i < n; i += 2 * gap)
		{
			int begin1 = i, end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + 2 * gap - 1;
			if (end1 >= n || begin2 >= n)
				break;
			else if (end2 >= n)
			{
				end2 =n - 1;
			}
			int m = end2 - begin1 + 1;//计数归并的总个数
			int j = begin1;
			while (begin1 <= end1 && begin2 <= end2)
			{
				if (a[begin1] < a[begin2])
				{
					tmp[j++] = a[begin1++];
				}
				else
					tmp[j++] = a[begin2++];
			}
			while (begin1 <= end1)
			{
				tmp[j++] = a[begin1++];
			}
			while (begin2 <= end2)
			{
				tmp[j++] = a[begin2++];
			}
			memcpy(a + i, tmp + i, sizeof(int) * m);
		}
		gap *= 2;
	}				
	free(tmp);
}

归并排序特性：

1. 归并的缺点在于需要O(N)的空间复杂度，归并排序的思考更多的是解决在磁盘中的外排序问题。
2. 时间复杂度：O(N*logN)
3. 空间复杂度：O(N)
4. 稳定性：稳定

八、计数排序

思想：计数排序又称为鸽巢原理，是对哈希直接定址法的变形应用。操作步骤：
1. 统计相同元素出现次数
2.排序，按出现次数写回原数组

void CountSort(int* a, int n)
{
	int min=a[0], max=a[0];
	//找最大最小值
	for (int i = 1; i < n; i++)
	{
		if (a[i] < min)
		{
			min = a[i];
		}
		if (a[i] > max)
		{
			max = a[i];
		}
	}
	//统计次数的数组
	int range = max - min + 1;//数组的大小
	int* count = (int*)malloc(sizeof(int) * range);
	if (count == NULL)
	{
		printf("malloc fail\n");
		exit(-1);
	}
	memset(count, 0, sizeof(int) * range);
	//统计次数
	for (int i = 0; i < n; i++)
	{
		count[a[i] - min]++;
	}
	//回写排序
	int j = 0;
	for (int i = 0; i < range; i++)
	{
		//出现几次，就回写几个i+min
		while (count[i]--)
		{
			a[j++] = min + i;
		}
	}
}

特性：

1. 计数排序在数据范围集中时，效率很高，但是适用范围及场景有限，比如是浮点数、字符串就不能排了。
2. 时间复杂度：O(MAX(N,范围))
3. 空间复杂度：O(范围)
4. 稳定性：稳定

九、总结

排序方法	平均情况	最好情况	最坏情况	辅助空间	稳定性
冒泡排序	O(n^2)	O(N)	O(N^2)	O(1)	稳定
简单选择排序	O(n^2)	O(N^2)	O(N^2)	O(1)	不稳定
直接插入排序	O(n^2)	O(N)	O(N^2)	O(1)	稳定
希尔排序	O(nlong)~O(n^2)	O(N^1.3)	O(N^2)	O(1)	不稳定
堆排序	O(nlogn)	O(nlogn)	O(nlogn)	O(1)	不稳定
归并排序	O(nlogn)	O(logn)	O(nlogn)	O(N)	稳定
快速排序	O(nlogn)	O(logn)	O(N^2)	O(logn)~O(N)	不稳定