【数据结构】拆分详解 - 排序


前言

  • 文章为了知识体系结构的分类,将冒泡排序放置在交换排序中讲解,如果读者对冒泡排序还不是很熟悉可以考虑先点击目录跳转,再回到开头处开始阅读,排序算法难度总体按从易到难介绍讲解
  • 文章讲解均以排升序为例

一、排序的概念及其运用

  1.1 排序的概念

排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录(值),若经过排序,这些记录的相对次序保持不变则称该种排序算法是稳定的。比如数组 2 1 1 0 ,若经过排序,原先第一个1的位置仍在第二个1的左边,即为相对次序不变,该种排序算法稳定。
内部排序:数据元素全部放在内存中的排序。
外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。

  1.2 排序的运用

在这里插入图片描述

在这里插入图片描述

  1.3 常见的排序算法

在这里插入图片描述

  1.4 排序算法性能测试对比函数

生成一组随机数,赋值给N个动态空间,控制变量使待排序数据完全一致,再测试各排序算法排序所耗时间(毫秒数),打印出来的值越大,性能越差。

void TestOP()
{
	srand(time(0));
	const int N = 100000;
	int* a1 = (int*)malloc(sizeof(int) * N);
	int* a2 = (int*)malloc(sizeof(int) * N);
	int* a3 = (int*)malloc(sizeof(int) * N);
	int* a4 = (int*)malloc(sizeof(int) * N);
	int* a5 = (int*)malloc(sizeof(int) * N);
	int* a6 = (int*)malloc(sizeof(int) * N);
	for (int i = 0; i < N; ++i)
	{
		a1[i] = rand();
		a2[i] = a1[i];
		a3[i] = a1[i];
		a4[i] = a1[i];
		a5[i] = a1[i];
		a6[i] = a1[i];
	}
	int begin1 = clock();
	InsertSort(a1, N);
	int end1 = clock();
	int begin2 = clock();
	ShellSort(a2, N);
	int end2 = clock();
	int begin3 = clock();
	SelectSort(a3, N);
	int end3 = clock();
	int begin4 = clock();
	HeapSort(a4, N);
	int end4 = clock();
	int begin5 = clock();
	QuickSort(a5, 0, N - 1);
	int end5 = clock();
	int begin6 = clock();
	MergeSort(a6, N);
	int end6 = clock();
	printf("InsertSort:%d\n", end1 - begin1);
	printf("ShellSort:%d\n", end2 - begin2);
	printf("SelectSort:%d\n", end3 - begin3);
	printf("HeapSort:%d\n", end4 - begin4);
	printf("QuickSort:%d\n", end5 - begin5);
	printf("MergeSort:%d\n", end6 - begin6);
	free(a1);
	free(a2);
	free(a3);
	free(a4);
	free(a5);
	free(a6);
}

二、常见排序算法的实现

  2.1 插入排序

   2.1.1  基本思想

直接插入排序是一种简单的插入排序法,其基本思想是:
把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列。
实际中我们玩扑克牌时,就用了插入排序的思想

在这里插入图片描述

   2.1.2  直接插入排序

在这里插入图片描述

     1. 单趟【局部】(将待排序的一个数插入一个有序区间,使插入后仍保持有序):

从后往前遍历有序区间,将待排序数与有序区间数一一进行比较,直到找到比待排序小的数,则插入到其后:

①:若待排序数较小,则 将末尾数到对应区间数 依次向后挪动一位
②:若待排序数较大,则插入到对应区间数后,结束

//[0,end]为有序区间,end+1位置为待排序数
int end;
int tmp = a[end + 1];
while (end >= 0) // 结束条件:end小于0
{
	if (tmp < a[end]) //待排序数较小
	{
		a[end + 1] = a[end];
		--end;
	}
	else
	{
		break;
	}
}

a[end + 1] = tmp;//循环结束说明找到插入位置,此时插入

     2. 多趟【整体】(控制区间从 [0,0] 到覆盖整个待排序区间 [0,N-1] )

单趟的效果是使单个有序区间保持有序,若使 【0,0】(仅含一个数据,可认为该区间必然有序)~ 【0,N-1】每个区间都有序,则整体有序

void InsertSort(int* a, int n)
{
	for (int i = 0; i < n - 1; i++) //控制区间[0,0] ~ [0,N-1]
	{
		int end = i;
		int tmp = a[end + 1];
		while (end >= 0)
		{
			if (tmp < a[end]) 
			{
				a[end + 1] = a[end];
				--end;
			}
			else
			{
				break;
			}
		}

		a[end + 1] = tmp;
	}
}

直接插入排序的特性总结

  1. 元素集合越接近有序,直接插入排序算法的时间效率越高
  2. 时间复杂度:O(N^2),最坏情况为完全逆序,每排一个数都要遍历一遍;
    最好情况为O(N),即完全有序时,遍历一遍即可
  3. 空间复杂度:O(1)
  4. 稳定性:稳定

   2.1.3  希尔排序

希尔排序法又称缩小增量法。希尔排序法的基本思想是:
先选定一个整数,把待排序文件中所有记录分成个组,所有距离为gap的记录分在同一组内,并对每一组内的记录进行排序。然后,改变gap值,重复上述分组和排序的工作,当到达gap=1时,所有记录在统一组内排好序。
(实际就是先进行预排序【将距离为gap的数看做一组,分为gap组,将每组分别进行插入排序】,再进行直接插入排序)

在这里插入图片描述

     1. 预排序(单趟)

方法①(一组一组排,好理解):

如上图,有红蓝绿三组,将红组排序完后,再排蓝组,绿组

int gap;
//控制一组排序完后开始下一组,j == 0 排红组,j == 1排蓝组...
for (int j = 0; j < gap; j++)
{
	//对一组进行插入排序
	for (int i = j; i < n - gap; i += gap)
	{				//i < n-gap 为画图分析总结出来的结束条件
		int end = i;
		int tmp = a[end + gap];
		while (end >= 0)
		{
			if (a[end + gap] > a[end])
			{
				a[end + gap] = a[end];
				end--;
			}
			else
			{
				break;
			}
		}
		a[end + gap] = tmp;
	}
}

方法②(多组并排,效率更高)

如前图,红蓝绿三组,将红组排一次后,不再继续排完红组而是去排一次蓝组,同理又去排一次绿组,然后又开始排红组,循环。相当于每一组,每次只排序一点,然后排另外一个组,多个组同时进行排序,但互不干扰影响,提高了效率。

for (int i = 0; i < n - gap; ++i)
{
	int end = i;
	int tmp = a[end + gap];
	while (end >= 0)
	{
		if (a[end + gap] > a[end])
		{
			a[end + gap] = a[end];
			end--;
		}
		else
		{
			break;
		}
	}
	a[end + gap] = tmp;
}
     2. gap值的选取与控制(多趟)
  1. gap值越大,大的值会更快地排到后面,小的值会更快地排到前面,越不接近有序;
    gap值越小,排的越慢,但也越接近有序。如果gap == 1就是直接插入排序。
  2. gap值随待排序数据个数变化而不断变化
  3. 关于gap值的选取,众说纷纭,没有一个确切的最优答案,最初Shell提出取gap = n / 2,gap /= 2,直到gap = 1,后来Knuth提出取gap = gap/3 + 1。还有其他的人提出自己的看法,但无论哪一种主张都没有得到证明。本文以Knuth取法为例。
void ShellSort(int* a, int n)
{
	int gap = n;
	while (gap > 1) //注释1
	{				
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; ++i)
		{
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (tmp < a[end])
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
					break;
				}
			}
			a[end + gap] = tmp;
		}
	}
}

注释①:不论gap为奇还是为偶,最终都会有gap为2时进入循环,此时gap = gap/3+1 = 1,为直接插入排序,结束后也应该结束循环,所以结束条件为 gap > 1

希尔排序的特性总结:

  1. 希尔排序是对直接插入排序的优化。
  2. 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。
  3. 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都不固定:
    《数据结构(C语言版)》— 严蔚敏
    在这里插入图片描述
    《数据结构-用面相对象方法与C++描述》— 殷人昆
    在这里插入图片描述
    出于便于记忆的角度,我们可以认为希尔排序的时间复杂度为O(N^1.3)
  4. 稳定性:不稳定


  2.2 选择排序

   2.2.1  基本思想

每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完 。

   2.2.2  直接选择排序

在这里插入图片描述
     1. 单趟(遍历待排序部分,选出最大数和最小数放入对应位置)

注:这里为优化写法,每次遍历选出两个极值,标准写法为每次只选出单个极值。

int mini = begin, maxi = begin;
for (int i = begin + 1; i <= end; ++i) //遍历,记录大值和小值的坐标
{
	if (a[i] < a[mini])
	{
		mini = i;
	}
	if (a[i] > a[maxi])
	{
		maxi = i;
	}
}

Swap(a[begin], a[mini]); //将大值和小值放入头部和尾部
if (maxi == begin) //注释1
{
	maxi = mini;
}
Swap(a[begin], a[maxi]);

注:记录的是坐标,而不是值
注释1:此处为同时选两数的“坑”,每次选一个极值不用单独判断。将mini 和 begin 交换,有可能maxi位置就是begin的位置,则交换后大值所在位置变化了,变成原先的mini位置,则更新maxi即可。

     2. 多趟(从头开始遍历整个数组即可 )

void SelectSort(int* a, int n)
{
	int begin = 0, end = n - 1;

	while (begin < end)
	{
		int mini = begin, maxi = begin;
		for (int i = begin + 1; i <= end; ++i)
		{
			if (a[i] < a[mini])
			{
				mini = i;
			}
			if (a[i] > a[maxi])
			{
				maxi = i;
			}
		}

		Swap(&a[begin], &a[mini]);
		if (maxi == begin)
		{
			maxi = mini;
		}
		Swap(&a[begin], &a[maxi]);

		++begin;
		--end;
	}
}

直接选择排序的特性总结:

  1. 直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用
  2. 时间复杂度:O(N^2)
  3. 空间复杂度:O(1)
  4. 稳定性:不稳定

   2.2.3  堆排序

堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。

  • 注:笔者曾写过堆的解析文章,里面详细讲解了堆排序,因为涉及的知识点较多,单独拎出来不便于讲解,此处只贴代码,有兴趣的读者可以点击此处查看,目录处可快速跳转对应知识点 【数据结构】拆分详解 - 堆
void AdjustDown(int* a, int size, int parent)
{
	int child = parent * 2 + 1;

	while (child < size)
	{
		// 假设左孩子小,如果解设错了,更新一下
		if (child + 1 < size && a[child + 1] > a[child])
		{
			++child;
		}

		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}
void HeapSort(int* a, int n)
{
	// 1.建大堆
	for (int i = (n-1-1)/2 ; i >= 0; i++)
	{
		AdjustDown(a, n, (n - 1 - 1) / 2);
	}
	// 2.排序
	int end = n - 1; //end标识堆尾元素下标
	while (end > 0)
	{
		swap(&a[0], &a[end]);
		AdjustDown(a, end, 0); //1.此处end作为向下调整的参数size,标识需要调整的元素个数(除去尾部排好的元素)
		end--;  //“尾删出”堆    //2.由于交换了头尾,需要从根(0)开始向下调整
	}
}

堆排序的特性总结

  1. 堆排序使用堆来选数,效率就高了很多。
  2. 时间复杂度:O(N*logN)
  3. 空间复杂度:O(1)
  4. 稳定性:不稳定

  2.3 交换排序

   2.3.1  基本思想

所谓交换,就是根据序列中两个值的比较结果来对换这两个值在序列中的位置。交换排序的特点是:将值较大的记录向序列的尾部移动,值较小的记录向序列的前部移动。

   2.3.2  冒泡排序

在这里插入图片描述
     1. 单趟(两两比较,将大数交换到最后)

for (int i = 0; i < n-1; i++)
{
	if (a[i] > a[i + 1])
	{
		Swap(&a[i], &a[i + 1]);
	}
}

     2. 多趟(控制结束位置,每冒泡一次,尾数必然是大数,不用再进行比较)

void BubbleSort(int* a, int n)
{
	for (int j = 0; j < n ; ++j)//注释2
	{
		for (int i = 0; i < n - 1 - j; i++)//注释1
		{
			if (a[i] > a[i + 1])
			{
				Swap(&a[i], &a[i + 1]);
			}
		}
	}
}

注释1
①如果是比较后一个与前一个,则写成 i = 0;i < n
②:(n-1) - j 表示每冒泡一次,待排序数就减少一个,减去相应的累计个数
注释2:如上方②,用 j 累计待排序数减少的个数

     3. 优化(有序时提前结束排序)

当遍历时,没发生一次交换,即整体有序,可以提前结束排序

void BubbleSort(int* a, int n)
{
	for (int j = 0; j < n ; ++j)
	{
		bool exchange = false;//设置标志
		for (int i = 0; i < n - 1 - j; i++)
		{
			if (a[i] > a[i + 1])
			{
				Swap(&a[i], &a[i + 1]);
				bool exchange = true;
			}
		}

		if (exchange == false) //没发生交换就直接结束
			return;
	}
}

冒泡排序的特性总结:

  1. 冒泡排序是一种非常容易理解的排序,地位等同于“hello world”。
  2. 时间复杂度:O(N^2)
  3. 空间复杂度:O(1)
  4. 稳定性:稳定

   2.3.3  快速排序

快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:
任取待排序元素序列中的某元素作为基准值,按照该基准值位置 将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后对左右子序列重复该过程,直到所有元素都排列在相应位置上为止。

     1. Hoare(霍尔)版本

在这里插入图片描述
     1.1 单趟

  1. 选出某元素(key)作为基准值,左边找大,右边找小,均找到后互换
  2. 直到相遇后,将key与相遇位置互换【先说结论,该位置对应值一定比key小,请思考一下为什么,后面我们会进行解答】
int PartSort1(int* a, int begin, int end)
{
	int left = begin, right = end;
	int keyi = begin;

	while (left <= right)
	{
		if (left <= right && a[right] >= a[keyi])
		{
			--right;
		}
		if (left <= right && a[left] <= a[keyi])
		{
			++left;
		}

		Swap(&a[left], &a[right]);
	}

	Swap(&a[left], &a[keyi]); // 将key交换回正确位置(相遇位置)
	return left; //返回相遇位置坐标以供后续递归设置新key
}

     1.2 多趟

经过单趟后,以基准值的正确位置【上一次的相遇位置】将待排序元素分为左右子列,递归重复单趟操作即可,类似于二叉树的前序遍历规则

//快排递归实现的主框架
void QuickSort(int* a, int begin, int end)
{
	if (begin >= end)
		return;

	//单趟排序的不同方法
	int keyi = PartSort1(a, begin, end);

	//[begin, keyi-1] keyi [keyi+1, end]
	QuickSort(a, begin, keyi - 1);
	QuickSort(a, keyi+1, end);
}

     1.3 缺点

  1. 易错(有坑):

①起始位置必须为left = begin ,而不能是left = begin + 1

  • 如下图,当对于有序数据时,如果设 left 为 begin 后一位,由于右边先走找小,必然找不到且和 left 相遇,left 随后要和 keyi 交换,这时候就出问题了,keyi为左端小值(6),交换后将有序打乱。left 如果设为 begin,最后交换时就是自身与自身交换,不影响。
    在这里插入图片描述

②找小找大时内部也要加判断 left < right,且注意相等情况 a[left] >= a[keyi], a[right] <= a[keyi];

  • 内部找大找小相遇时要停下,外层限制无法及时约束内部
  • 如下图,如果有多个相同的数据,恰好keyi也是其中之一,则左边和右边如果找到相同值时停止,则排序陷入死循环。
    在这里插入图片描述
  1. 对于有序或接近有序的数据,效率较低,且可能栈溢出
  • 如下图,当接近有序时,基准值正确的位置偏向左端,导致找小数时只能找的很少个,每次也只能排少数个,时间复杂度接近O(N^2)。基准值正确位置越偏向中间,时间复杂度越接近O(N*logN),后面我们会用三数取中对快排进行优化。
    在这里插入图片描述

     1.4 优化及思考
1. 三数取中

选取合适的基准值,使其正确位置接近待排序数据的中部。这里我们采用取中位数的方法,在begin,end 和 它们的平均数,三个数之间选中间数作为基准值的坐标。

int GetMidi(int* a, int begin, int end)
{
	int midi = (begin + end) / 2;
	if (a[begin] < a[midi])
	{
		if (a[midi] < a[end])
			return midi;
		else if (a[begin] < a[end])
			return end;
		else
			return begin;
	}
	else
	{
		if (a[midi] > a[end])
			return midi;
		else if (a[begin] > a[end])
			return end;
		else
			return begin;
	}
}
int PartSort1(int* a, int begin, int end)
{
	int midi = GetMidi(a, begin, end);
	Swap(&a[begin], &a[midi]);
	//.......后续与前文单趟完全相同,为避免篇幅过长,此处省略不写
}

2. 为什么相遇位置对应值一定比key小?

  • 因为右边先走。
    在这里插入图片描述
    在这里插入图片描述

由上述分析可知,霍尔版本的快排缺点较多,比较容易坑,下面我们讲解两种在思路上优化后的快排版本。


     2. 挖坑法

在这里插入图片描述

  1. 将key值位置作为初始坑位,右边先走找小数,找到后将小值放入坑中,小值原先位置形成新的坑位;
  2. 然后左边找大,将大值放入坑位,大值原先位置形成新的坑位
  3. 重复上述步骤直到左右相遇,将key值放入坑中
  • 挖坑法 以及后续要介绍的 前后指针法霍尔版本 在快排递归主框架上一致,只是单趟排序的处理有所差异,后续不再赘述多趟框架,只给出差异部分
//挖坑法
int PartSort2(int* a, int begin, int end)
{
	int midi = GetMidi(a, begin, end);
	Swap(&a[begin], &a[midi]);

	int key = a[begin];
	int hole = begin;
	while (begin < end)
	{
		//右边找小,填到左边的坑
		while (begin < end && a[end] >= a[key])
		{
			--end;
		}

		a[hole] = a[end];
		hole = end;

		//左边找大,填到右边的坑
		while (begin < end && a[begin] <= a[key])
		{
			++begin;
		}

		a[hole] = a[begin];
		hole = begin;
	}

	a[hole] = key;
	return hole;
}
     3. 前后指针法

在这里插入图片描述

使用前后指针法,即用两个指针,保持位置一前一后的关系,cur指针找小数

  1. cur遇到大数,++cur;
  2. cur遇到小数,++prev,交换 prev 与 cur 的对应值,++cur;
  3. 初始位置如下。核心思想是prev 和 cur 之间始终保持相隔的为大数,则cur不断找小与其对换。

在这里插入图片描述

int PartSort3(int* a, int begin, int end)
{
	int midi = GetMidi(a, begin, end);
	Swap(&a[begin], &a[midi]);
	int keyi = begin;

	int prev = begin;
	int cur = prev + 1;
	while (cur <= end)
	{
		if (a[cur] < a[keyi] && ++prev != cur)
			Swap(&a[prev], &a[cur]);

		++cur;
	}

	Swap(&a[prev], &a[keyi]);
	keyi = prev;
	return prev;
}
     4. 非递归写法
  1. 利用栈 后进先出 性质
  2. 本质和递归一样,都是利用单趟处理区间,从递归变化区间改为利用栈变化区间
void QuickSortNonR(int* a, int begin, int end)
{
	StackDataType s;
	StackInit(&s);
	StackPush(&s, end);
	StackPush(&s, begin);
	
	//栈为空说明不再有数据进栈,待排序数据全都处理完毕
	while (!StackEmpty(&s))
	{
		int left = StackTop(&s);
		StackTop(&s);
		int right = StackTop(&s);
		StackTop(&s);

		int keyi = PartSort3(a, left, right);

		// [left, keyi-1] keyi [keyi+1, right]
		if (left < keyi - 1)
		{
			StackPush(&s, keyi - 1);
			StackPush(&s, left);
		}

		if (keyi + 1 < right)
		{
			StackPush(&s, right);
			StackPush(&s, keyi + 1);
		}
	}

	StackDestory(&s);
}

快速排序的特性总结:

  1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序
  2. 时间复杂度:O(N*logN)
  3. 空间复杂度:O(logN),递归需要开辟栈空间
  4. 稳定性:不稳定

  2.4 归并排序

   2.4.1  基本思想

归并排序 是建立在归并操作上的一种有效的排序算法,该算法是采用 分治法 的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列合并有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤:

  1. 如下图,将待排序区间不断二分,直到分割为区间仅有一个数据,此时必然有序
  2. 子序列有序后,就可以开始合并了,则依次两两合并回去,最终整体有序

在这里插入图片描述
在这里插入图片描述

   2.4.2  代码实现

  1. 本质为后序递归,即递推完,在回归的过程中进行排序
  2. 注意点:
  • 开辟一块新空间存放排好序的数据
  • 每两两比较排序一次就拷贝一次
  • 排序部分单独提取出一个函数块,方便控制开辟空间(只需要开辟一次)
void _MergeSort(int* a, int begin, int end, int* tmp)
{
	if (begin >= end)
		return;

	int mid = (begin + end) / 2;
	//[begin, mid] [mid+1, end]
	_MergeSort(a, begin, mid, tmp);
	_MergeSort(a, mid+1, end, tmp);

	//[begin, mid] [mid+1, end] 归并
	int begin1 = begin, end1 = mid;
	int begin2 = mid + 1, end2 = end;
	int i = begin;
	//结束条件:其一区间数被拷贝完
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (a[begin1] < end1 && begin <= end2)
		{
			tmp[i++] = a[begin1++];
		}
		else
		{
			tmp[i++] = a[begin2++];
		}
	}

	//用两个while循环,剩余哪个区间没拷贝完就接着拷贝哪个,不用再去判断具体是哪个没拷贝完
	while (begin1 <= end1)
	{
		tmp[i++] = a[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[i++] = a[begin2++];
	}

	memcpy(a + begin, tmp + begin, sizeof(int) * (end - begin + 1));
}

void MergeSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail");
		return;
	}

	_MergeSort(a, 0, n - 1, tmp);

	free(tmp);
}

   2.4.3  非递归实现

  1. 如第二幅图,本质是利用gap控制区间模拟归并过程【gap表示两组数据归并时,每组的数据个数】
  2. 易错点:
    gap模拟归并是粗暴的,只适用于满二叉树的二分情况。由下图和所学二叉树可知当待排序数个数为2的n次方时,可以看作满二叉树。但如黑底图红色划横处,待排序数有10个,此时非满二叉树,正常运行会导致越界获取不足的数据个数,需要对代码进行修正

① end1 和 begin2 越界:说明数据个数已经不足,待排序数据已经获取完毕,此时直接break结束即可
② end2 越界:结合①的判断代码,此时 begin2 未越界,说明第二组有数据但数据个数不满,修正为最末数下标(有多少排序多少)
③ 最后拷贝时的数据大小计算:数据个数 = 闭区间 - 闭区间 + 1

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

void MergeSortNonR(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail");
		return;
	}

	int gap = 1;
	while (gap < n)
	{
		for (size_t i = 0; i < n; i += 2 * gap)
		{
			int begin1 = i, end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + 2 * gap - 1;
			// [begin1, end1][begin2, end2] 归并
			
			// 易错点1
			if (end1 >= n || begin2 >= n)
			{
				break;
			}
			// 易错点2
			if (end2 >= n)
			{
				end2 = n - 1;
			}

			int j = begin1;
			while (begin1 <= end1 && begin2 <= end2)
			{
				if (a[begin1] < a[begin2])
				{
					tmp[j++] = a[begin1++];
				}
				else
				{
					tmp[j++] = a[begin2++];
				}
			}

			while (begin1 <= end1)
			{
				tmp[j++] = a[begin1++];
			}

			while (begin2 <= end2)
			{
				tmp[j++] = a[begin2++];
			}
			//易错点3
			memcpy(a + i, tmp + i, sizeof(int) * (end2-i+1));
		}

		printf("\n");

		gap *= 2;
	}
	
	free(tmp);
}

归并排序的特性总结

  1. 归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
  2. 时间复杂度:O(N*logN)
  3. 空间复杂度:O(N)
  4. 稳定性:稳定

  2.6 计数排序

思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。
操作步骤:

  1. 统计相同元素出现次数
  2. 根据统计的结果将序列回收到原来的序列中
void CountSort(int* a, int n)
{
	int min = a[0], max = a[0];
	for (int i = 1; i < n; i++)
	{
		if (a[i] < min)
			min = a[i];

		if (a[i] > max)
			max = a[i];
	}

	int range = max - min + 1;
	int* count = (int*)calloc(range, sizeof(int));
	if (count == NULL)
	{
		printf("calloc fail\n");
		return;
	}

	// 统计次数,使用相对映射,使范围处于0~x
	for (int i = 0; i < n; i++)
	{
		count[a[i] - min]++;
	}

	// 排序
	int i = 0;
	for (int j = 0; j < range; j++)
	{
		while (count[j]--)
		{
			a[i++] = j + min;
		}
	}
}

计数排序的特性总结:

  1. 效率极高,但是不适合分散数据,浮点数,字符串,结构体,只适合整数
  2. 时间复杂度:O(MAX(N,范围))
  3. 空间复杂度:O(范围)
  4. 稳定性:稳定

三、排序算法复杂度及稳定性分析

在这里插入图片描述
在这里插入图片描述


总结

本文介绍了排序的相关概念,拆解了常见的排序算法,知识框架可看文章开头的目录。
尽管文章修正了多次,但由于水平有限,难免有不足甚至错误之处,欢迎各位读者来评论区批评指正。全文字数12k,感谢你能看到这里。

  • 25
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值