【数据结构】带你细致理解十大排序(附源码)

前言

以下排序,实现的都是升序
为了简化操作:这里将打印函数和交换函数以及头文件先给出

#include<stdio.h>
#include<stdbool.h>
void Swap(int* n1, int* n2)
{
	int tmp = *n1;
	*n1 = *n2;
	*n2 = tmp;
}

void Print(int* arr,int size)
{
	for (int i = 0; i < size; i++)
	{
		printf("%d ", arr[i]);
	}
	printf("\n");
}

建议:先写一趟的,再写全部的

  • 补充知识:排序的稳定性指的是:排序前后相同数据的相对位置变化的情况,如果排序之后没有发生变化化,我们就称这个排序算法是稳定的!

一. 冒泡排序

  • 思想:通过两两打擂台的方式,强者胜出,每个人都打一次,从而筛选出一个冠军,把冠军排除在外,让剩余的人继续打,再打一次筛选亚军,以此类推得出每一个人的排名。
  • 把人换成数字带进去便可理解冒泡的思想
  • 交换条件: 后一个数小或者前一个数大
  • 我用的是:前一个数大
//动态图使用的数组:
	int arr[] = { 3,44,38,5,47,15,36,26,27,2,46,4,19,50,48 };
	int size = sizeof(arr) / sizeof(arr[0]);

在这里插入图片描述

前一个数跟后一个数比较

  • 起点从第一个元素开始,到倒数第二个元素结束
void BubbleSort1_0(int *arr,int size)
{

	//总躺数:size - 1,最后一趟只剩下最后一个数就不用比了
	for (int i = 0; i < size - 1; i++)
	{
		//拿前一个数跟后一个数比较的一趟
		for (int j = 0; j < size - 1 - i; j++)
		{
			//如果前一个数大就交换
			if (arr[j] > arr[j + 1])
			{
				Swap(&arr[j], &arr[j + 1]);
			}
		}
	}
}

后一个数跟前一个数比较

  • 第一趟的起点从第二个元素开始,终点到最后一个元素
void BubbleSort2_0(int* arr, int size)
{

	//总躺数:size - 1,最后一趟只剩下最后一个数就不用比了
	for (int i = 0; i < size - 1; i++)
	{
		//拿后一个数跟前一个数比较的一趟
		for (int j = 1; j < size - i; j++)
		{
			//如果前一个数大就交换
			if (arr[j-1] > arr[j])
			{
				Swap(&arr[j], &arr[j - 1]);
			}
		}
	}
}

优化

  • 当比较完一趟时,如果有序不用再比了。
void BubbleSort1_1(int* arr, int size)
{

	//总躺数:size - 1,最后一趟只剩下最后一个数就不用比了
	for (int i = 0; i < size - 1; i++)
	{
		//若是有序的就跳出,假设是有序的

		bool Is_Order = true;
		//拿前一个数跟后一个数比较的一趟
		for (int j = 0; j < size - 1 - i; j++)
		{
			//如果前一个数大就交换,如果是无序的才会进去if
			if (arr[j] > arr[j + 1])
			{
				Swap(&arr[j], &arr[j + 1]);
				Is_Order = false;
			}
		}
		if (Is_Order)
		{
			break;
		}
	}
}

复杂度与稳定性

  • 最坏的情况:排升序数据是降序,排降序时升序——O(N2)

时间复杂度的准确函数表达式:F(N)=1+2+……+N-1=(N-1)*N/2=N2 / 2 - N / 2

  • 最好的情况:排升序是升序,排降序时降序——O(N),这是优化之后的冒泡

在接近有序的情况下:数据的准确函数表达式为:F(N)=a*N,a是大于等于1的正整数

  • 空间:没有使用额外的空间——O(1)
  • 稳定性:因为相同数据前后并不会发生交换,因此冒泡排序算法稳定

二. 插入排序

在这里插入图片描述

  • 思想:洗牌
  • 先从牌头开始洗,遇到大于的就把牌插入它的前面,遇到不大于的就停止,以此类推。

在这里插入图片描述

初始化条件从第一个元素开始

void InsertSort1_0(int* arr, int size)
{
	for (int i = 0; i < size-1; i++)//结束条件:倒数第二个数
	{
		int cur = arr[i + 1];//这里要注意边界问题
		int end = i;
		while (1)
		{
			if (end >= 0 && arr[end] > cur)
			{
				arr[end + 1] = arr[end];
				end--;
			}
			else
			{
				arr[end + 1] = cur;
				break;
			}
		}
	}
}

初始化条件从第二个元素开始

void InsertSort1_1(int* arr, int size)
{
	for (int i = 1; i < size; i++)//结束条件为:倒数第一个元素
	{
		int cur = arr[i];
		int end = i - 1;
		while (end >= 0)
		{
			if (cur < arr[end])
			{
				arr[end + 1] = arr[end];
				end--;
			}
			else
			{
				break;
			}
		}
		arr[end + 1] = cur;
	}
}

复杂度与稳定性

  • 最坏的情况:排升序数据是降序,排降序时升序——O(N2)

函数表达式:F(N)=1+2+3+4+5+……+N=(N+1)*N / 2

  • 最好的情况:接近有序——O(N)

函数表达式:F(N)=a*N,a为正整数
与冒泡比较,插入排序较好,原因是在接近有序的情况下,插入相当于只需遍历一次,冒泡至少要遍历两次。

  • 没有用额外的空间——O(1)
  • 相等的数据并不会发生交换,因此插入排序的稳定性很好

三. 选择排序

在这里插入图片描述

一趟选出一个最小的

  • 选完之后,与最左边交换
  • 处理好的数据就不再动了
void SelectSort1_0(int* arr, int size)
{
	//总的比较次数
	for (int j = 0; j < size; j++)
	{
		//先选出最小的下标
		int min = j ;
		for (int i = j+1; i < size; i++)
		{
			if (arr[min] > arr[i])
			{
				min = i;
			}
		}
		//与正在处理的最左边的数据进行交换
		Swap(&arr[min], &arr[j]);
		
	}
}

一趟选出一个最大的和一个最小的

  • 当选完之后,一种特殊情况:
  • 最大的下标与交换的最左边下标时,最左边下标是最小值的下标
  • 因此:交换之后,要更新最小值的下标为最大值的下标
void SelectSort1_1(int* arr, int size)
{
	int begin = 0;
	int end = size - 1;
	
	while (begin < end)
	{
		int max = begin;
		int min = begin;
		//选出最大的和最小的
		for (int i = begin+1; i <= end; i++)
		{
			if (arr[max] < arr[i])
			{
				max = i;
			}
			if (arr[min] > arr[i])
			{
				min = i;
			}
		}
		Swap(&arr[max], &arr[end]);
		if (end == min)
		{
			min = max;
		}
		Swap(&arr[min], &arr[begin]);
		//更新处理的数据范围
		end--;
		begin++;
	}
}

复杂度与稳定性

  • 最坏的情况与最好的情况相同——O(N2)

第一种:选出最小的时间复杂度的函数表达式F(N)=1+2+3+……N-1=N2 / 2 - N / 2
第二种:选出最大的和最小的时间复杂度表达式F(N)=2+4+6+8+……+N-1=(N-1+2)*(N-1)/2/2=(N2-1)/4

  • 没有用额外的空间——O(1)
  • 假如对1,1,-1排序,选出最小的-1会对最左边的1进行交换,破坏了1,1的相对顺序,因此选择排序是不稳定的

四. 堆排序

  • 核心思想:排升序建大根堆,排降序建小根堆
  • 注意:下标与边界问题
    在这里插入图片描述

建堆用向下调整

void AdjustDown(int* arr, int parent, int size)
{
	//假设左孩子是比较大的
	int child = 2 * parent + 1;
	while (child < size)
	{
		//如果右孩子大就把孩子给右孩子
		if (child + 1 < size && arr[child + 1] > arr[child])
		{
			child++;
		}
		if (arr[child] > arr[parent])//孩子大就进行交换
		{
			Swap(&arr[child], &arr[parent]);
			parent = child;
			child = 2 * parent + 1;
		}
		//小于等于就跳出循环
		else
		{
			break;
		}
	}
}

void HeapSort(int* arr, int size)
{
	//升序建大堆
	for (int i = ((size - 1) - 1) / 2; i >= 0; i--)
	{
		AdjustDown(arr, i, size);
	}
	int end = size - 1;//最后一个数的下标
	while (end)//end为0表明只有一个数据,因此不用再循环
	{
		Swap(&arr[end], &arr[0]);
		end--;
		AdjustDown(arr, 0, end + 1);//这里的end+1指的是需要管理的数据个数
	}
}

建堆用向上调整

void AdjustUp(int* arr, int child)
{
	int parent = (child - 1) / 2;
	while (child > 0)
	{
		if (arr[parent] < arr[child])
		{
			Swap(&arr[parent], &arr[child]);
			child = parent;
			parent = (child - 1) / 2;
		}
		else
		{
			break;
		}
	}
}
void HeapSort(int* arr, int size)
{
	//升序建大堆
	for (int i = 1; i < size; i++)
	{
		AdjustUp(arr, i);
	}
	int end = size - 1;//最后一个数的下标
	while (end)//end为0表明只有一个数据,因此不用再循环
	{
		Swap(&arr[end], &arr[0]);
		end--;
		AdjustDown(arr, 0, end + 1);//这里的end+1指的是需要管理的数据个数
	}
}

复杂度与稳定性

  • 向下调整建堆的时间复杂度为O(N),向上调整建堆的时间复杂度为O(NlogN),排序的时间复杂度为O(NlogN),综合看堆排序的时间复杂度为O(N*logN)
  • 由于是在数组里面建堆的。没有使用额外的空间——O(1)
  • 当堆是2,1,1时,2会先与最后的1发生交换,破坏了相同数据的相对位置,因此堆排序是不稳定的

五. 希尔排序

  • 思想:想象一下你要到很远的地方,拜访朋友,你大概率不会走路过去,假设是坐飞机过去,到飞机场这时离朋友的家不算太远了,但大概率走路需要很远才到,这时又做出租车过去,又离朋友更近一步,到朋友家一段距离我们都会出于礼貌,再步行一段距离到朋友家。
  • 代入希尔排序:先坐飞机,再坐出租车,最后走路,这样初速度很大,但在慢慢变小的,整体在趋近有序,这就是希尔排序的思想
  • gap其实就是我们换乘的工具——飞机,出租车,走路
    在这里插入图片描述

初始化条件为0,结束条件为size-gap

 void ShellSort(int *arr,int size)
{
	int gap = size;
	while (gap > 1)
	{
		gap = gap / 3+1;//加1是为了要处理的gap等于2时的情况
		for (int i = 0; i < size-gap ; i++)
		{
			int cur = arr[i+gap];
			//cur指向最后一个元素下标时为:size-gap+gap-1即为size-1
			int end = i;
			while (end >= 0)
			{
				if (cur < arr[end])
				{
					arr[end + gap] = arr[end];
					end -= gap;
				}
				else
				{
					break;
				}
			}
			arr[end + gap] = cur;
		}
		
	}
}

初始化条件为gap,结束条件为size

void ShellSort(int *arr,int size)
{
	int gap = size;
	while (gap > 1)
	{
		gap = gap / 3+1;//加1是为了要处理的gap等于2时的情况
		for (int i = gap; i < size ; i++)
		{
			int cur = arr[i];
			int end = i-gap;
			while (end >= 0)
			{
				if (cur < arr[end])
				{
					arr[end + gap] = arr[end];
					end -= gap;
				}
				else
				{
					break;
				}
			}
			arr[end + gap] = cur;
		}
		
	}
}

复杂度与稳定性

  • 很遗憾由于一些的数学难题尚未被攻破,时间复杂度我们很难进行准确的计算,但是一些局部的数据表明希尔排序的时间复杂度为:O(N1.25)到O(1.65N1.25)范围内,这是Knuth提出的,并且做了大量的实验数据
  • 没有使用额外的空间——O(1)
  • 因为希尔排序在排序1,1,-1假如gap为2,这里的1和-1会交换位置,从而破坏了相同数据1,1的相对位置,因此希尔排序是不稳定的

六. 快速排序

原始Hore版本

在这里插入图片描述

void QuickSort(int *arr,int left,int right)
{
    if(left>=right)
    {
        return;
    }
    int key=left;
    int begin = left;
    int end =right;
    while(begin<end)
    {
        while(begin<end&&arr[end]>=arr[key])
        {
            end--;
        }
        while(begin<end&&arr[begin]<=arr[key])
        {
            begin++;
        }
        Swap(&arr[begin],&arr[end]);
    }
    key = end;
    Swap(&arr[left],&arr[key]);
    //剩余[left,key-1]与[key+1,right]
    QuickSort(arr,left,key-1);
    QuickSort(arr,key+1,right);
}
  • 循环内部和外部都得保证begin小于end
  • 左边先走,保证了最后遇到的是比key小的数
  • 遇到和key 相等的数据时,在左边和在右边都无所谓,因此不用管
  • 走完一趟后已经排好一个数的位置了,剩余的区间为[left,key-1]与[key+1,right]
  • 走完一趟后还需要更新key值
  • 递归的返回条件:left>=right

挖坑法

在这里插入图片描述

  • 因为第一个坑位在最左边,所以首先要保存key值
  • 右边先走找到小的就放进坑位,左边后走找大的放进坑位
  • 坑位在不断更新
  • 最后一个坑位:左边等于右边,即为key值的下标
  • 最后把坑里放进key值即可
void QuickSort2_0(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}
	int key = arr[left];
	int hole = left;
	int begin = left;
	int end = right;
	while (begin < end)
	{
		while (begin < end && arr[end] >= key)
		{
			end--;
		}
		Swap(&arr[end], &arr[hole]);
		hole = end;
		while (begin < end && arr[begin] <= key)
		{
			begin++;
		}
		Swap(&arr[begin], &arr[hole]);
		hole = begin;
	}
	arr[hole] = key;
	//剩余[left,hole-1]与[hole+1,right]
	QuickSort2_0(arr, left, hole - 1);
	QuickSort2_0(arr, hole + 1, right);
}

前后指针法

在这里插入图片描述

  • cur找比key小的,prev用于交换数据
  • cur与prev之间存的是比key大的数prev以及以前存的是小于等于key的值
  • 最后cur走完数组,prev的位置就是坑位
void QuickSort3_0(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}
	int key = left;
	int prev = left;
	int cur = left+1;
	while (cur <= right)//注意等于,这里的right是数组的
	{
		if (arr[cur] < arr[key])
		{
			prev++;
			Swap(&arr[cur], &arr[prev]);
		}
		cur++;
	}
	Swap(&arr[prev], &arr[key]);
	key = prev;
	//剩余[left,key - 1]与[key + 1,right]
	QuickSort3_0(arr, left, key - 1);
	QuickSort3_0(arr, key + 1, right);
}

非递归快排

  • 非递归要使用的单趟排序,这里先列出来
  • 由于要使用栈和对列的结构,C语言得自己搓(我这里就省了)
  • 栈和对列的结构可自行在此文章里复制:栈和对列
int _QuickSort(int* arr, int left, int right)
{
	int key = left;
	int prev = left;
	int cur = left + 1;
	while (cur <= right)
	{
		if (arr[cur] < arr[key])
		{
			prev++;
			Swap(&arr[cur], &arr[prev]);
		}
		cur++;
	}
	Swap(&arr[prev], &arr[key]);
	key = prev;
	return key;
}

前序遍历

void QuickSortNonR1_0(int* arr, int left, int right)
{
	Stack s;
	StackInit(&s);
	StackPush(&s, right);
	StackPush(&s, left);
	while (!StackEmpty(&s))
	{
		int begin = StackTop(&s);
		StackPop(&s);

		int end = StackTop(&s);

		StackPop(&s);

		int key = _QuickSort(arr, begin, end);

		//[begin,key-1]
		//[0,1]
		//两个元素:key-1>begin
		if (key - 1 > begin)
		{
			StackPush(&s, key - 1);
			StackPush(&s, begin);
		}
		//[key+1,end]
		if (key + 1 < end)
		{
			StackPush(&s, end);
			StackPush(&s, key + 1);
		}
	}
}

层序遍历

void QuickSortNonR1_1(int* arr, int left, int right)
{
	Queue q;
	QueueInit(&q);
	QueuePushBack(&q, left);
	QueuePushBack(&q, right);
	while (!QueueEmpty(q))
	{
		int begin = QueueTop(q);
		QueuePopFront(&q);
		int end = QueueTop(q);
		QueuePopFront(&q);

		int key = _QuickSort(arr, begin, end);
		
		//[begin,key-1][key+1,end]
		if (begin < key - 1)
		{
			QueuePushBack(&q,begin);
			QueuePushBack(&q, key - 1);
		}
		if (key + 1 < end)
		{
			QueuePushBack(&q,key + 1);
			QueuePushBack(&q, end);
		}
	}
}

复杂度与稳定性

  • 时间复杂度
    在理想状况下
    在这里插入图片描述
    每一层排序N个数据,设分h次把数据分完,则2的h次方就等于N个数据
    则:高度为log2N
    因此理想状况下时间复杂度为:O(N*log2N)
    最坏的情况
    当排升序数据是降序时,递归是N*(N-1)(N-2)……1——高度是N
    如图:
    在这里插入图片描述
    时间复杂度可以估算为O(N2)
    这样数据大的话递归层数过多,甚至会导致栈溢出!

  • 空间复杂度——递归层数为logN到N因此空间复杂度为——O(logN)到O(N)

  • 稳定性
    在排序1 2 -1 -1时,由于左边的数据会先交换——1 -1 -1 2,破坏了相同数据的相对位置,因此快排不是稳定的。

优化

三数取中

int GetMid(int* arr, int left, int right)
{
	int mid = (left + right) / 2;
	if (arr[mid] > arr[left])
	{
		if (arr[right] >= arr[mid])
		{
			return mid;
		}
		else//arr[mid]>a[right]
		{
			if (arr[right] >= arr[left])
			{
				return right;
			}
			else
			{
				return left;
			}

		}
	}
	else//arr[left]>=arr[mid]
	{
		if (arr[mid] >= arr[right])
		{
			return mid;
		}
		else//arr[right]>arr[mid]
		{
			if (arr[right] >= arr[left])
			{
				return left;
			}
			else
			{
				return right;
			}
		}
	}
}

设置随机key

void Randkey(int* arr, int left, int right)
{
	srand((unsigned int)time(NULL));
	int key = rand() % (right - left) + left;
	Swap(&arr[key], &arr[left]);
}

小区间优化

  • 一颗满二叉树的结点个数为:2n - 1(n为高度)
  • 但是最后一层的结点个数就: 2n / 2,就占了满二叉树近一半的节点
  • 因此如果将最后几层的节点的排序省去就可以提高一部分的效率,那怎么优化呢?
  • 我们选择希尔排序作为最后几层的排序,同时多少算合适呢?
  • 一般来说我们选择10层左右比较合适,最后的数据如果大于10个用快排,小于十个用希尔排序

以下是具体的代码实现

void QuickSort3_0(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}
	int mid = GetMid(arr, left, right);
	if (mid != left)
	{
		Swap(&arr[left], &arr[mid]);
	}
	int key = arr[left];
	if (right - left > 10)
	{
		//快排我就不写了
	else
	{
		ShellSort(arr, right - left + 1);
	}
}

  • 以上两种将最坏的情况的可能降到最低,但是如果大量的数据相同呢?
  • 时间复杂度毫无疑问还是O(N2),有什么方法解决吗?
  • 答案是有的——三路划分

三路划分

  • 当数据存在大量相同时,我们是否可以优化一下呢?
  • 所谓三路划分也就是
  • 1.等于key的分一堆
  • 2.大于key的分一堆
  • 3.小于key的分一堆

  • 具体思路:
  • 1.设置一个cur指向key的下一个元素,设置一个right指向最右边的元素,设置一个left指向最左边的元素。
  • 2.如果cur指向的元素大于key就跟最右边换,同时right要减减
  • 3.如果cur指向的元素小于key就跟最左边换,同时left要加加,cur也要加加。
  • 4.如果cur指向的元素等于key就啥也不干,但cur要加加
  • 4.当cur大于right就停止,也就是说循环继续的条件是——cur<=right
  • 这样第一次排完之后就会形成这样的三部分:
    1. [0,left-1] 就是小于key的一部分
    1. [left,right] 就是等于key的一部分
    1. [right+1,数组的另一边界],就是大于key的一部分
  • 这样就达成了三路划分
void QuickSort3_0(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}
	int mid = GetMid(arr, left, right);
	if (mid != left)
	{
		Swap(&arr[left], &arr[mid]);
	}
	int key = arr[left];
	if (right - left > 10)
	{
		int left1 = left;
		int cur = left + 1;
		int right1 = right;
		//三路划分
		while (cur <= right1)
		{
			if (arr[cur] < key)
			{
				Swap(&arr[cur], &arr[left1]);
				cur++;
				left++;
			}
			else if (arr[cur] > key)
			{
				Swap(&arr[cur], &arr[right1]);
				right--;
			}
			else//arr[cur]=arr[]
			{
				cur++;
			}
		}
		//剩余[left,key - 1]与[key + 1,right]
		QuickSort3_0(arr, left, left1 - 1);
		QuickSort3_0(arr, right1 + 1, right);
	}
	else
	{
		ShellSort(arr, right - left + 1);//这里的希尔排序跟上面的一样
	}
}
//这是三路划分的关键思路
//while (cur <= right1)
//{
//	if (arr[cur] < key)
//	{
//		Swap(&arr[cur], &arr[left1]);
//		cur++;
//		left++;
//	}
//	else if (arr[cur] > key)
//	{
//		Swap(&arr[cur], &arr[right1]);
//		right--;
//	}
//	else//arr[cur]=arr[]
//	{
//		cur++;
//	}
//}

七.归并排序

在这里插入图片描述

递归写法

  • 将数据被拆分成有序的情况——一个的一个数据
  • 再将一个数据和另一数据进行排序。
  • 然后再用一组中含有连个数据排序与另一组中两个数据进行排序
  • 依次类推,直到整个数据有序
  • 排序需要用到另一个数组,排序完然后拷贝回去。
  • 注意:拷贝回去的起点需要注意。
//这是由于要开辟数据所以写了两个函数
void _MergeSort(int* arr, int* tmp, int left, int right)
{
	if (left >= right)
	{
		return;
	}
	int mid = (left + right) / 2;
	_MergeSort(arr, tmp, left, mid);
	_MergeSort(arr, tmp, mid + 1, right);
	int begin1 = left;
	int end1 = mid;
	int begin2 = mid + 1;
	int end2 = right;
	int i = left;
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (arr[begin1] <= arr[begin2])
		{
			tmp[i++] = arr[begin1++];
		}
		else
		{
			tmp[i++] = arr[begin2++];
		}
	}
	while (begin1 <= end1)
	{
		tmp[i++] = arr[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[i++] = arr[begin2++];
	}
	memcpy(arr + left, tmp + left, sizeof(int) * (right - left + 1));
	//切记arr跟arr+left指向的位置可不一样!
}
void MergeSort(int* arr, int size)
{
	int* tmp = (int*)malloc(sizeof(int) * size);
	if (tmp == NULL)
	{
		perror("malloc fail");
		exit(-1);
	}
	_MergeSort(arr, tmp, 0, size-1);
}

非递归写法

  • 从递归的最底层进行排序,也就是gap等于1
  • 不断分组进行排序——相当于倒着的层序遍历
  • 每一层遍历之后gap乘等2,直到大于原数组的大小为止
  • 其次还要考虑边界的处理

一把梭哈

void MerageSortNonR1_0(int* arr, int size)
{
	int* tmp = (int*)malloc(sizeof(int) * size);
	if (tmp == NULL)
	{
		perror("malloc fail");
		exit(-1);
	}

	int gap = 1;
	while (gap < size)
	{
		for (int i = 0; i < size; i += 2*gap)
		{
			//归并的两个区间
			int begin1 = i;
			int end1 = i + gap - 1;
			int begin2 = i + gap;
			int end2 = i + 2 * gap - 1;
			//修正越界的部分
			//首先begin1是不可能越界的
			//end1越界
			//修正end1
			//因为梭哈要全拷贝
			//修正end2与begin2满足begin2>=end2
			//begin2越界
			//修正end2与begin2满足begin2>=end2
			//end2越界
			//修正end2
			if (end1 >= size)
			{
				end1 = size - 1;
				begin2 = size;
				end2 = size - 1;
			}
			else if (begin1 >= size)
			{
				begin2 = size;
				end2 = size - 1;
			}
			else if (end2 >= size)
			{
				end2 = size - 1;
			}
			//排序
			int j = i;
			while (begin1 <= end1 && begin2 <= end2)
			{
				if (arr[begin1] <= arr[begin2])
				{
					tmp[j++] = arr[begin1++];
				}
				else
				{
					tmp[j++] = arr[begin2++];
				}
			}
			while (begin1 <= end1)
			{
				tmp[j++] = arr[begin1++];
			}
			while (begin2 <= end2)
			{

				tmp[j++] = arr[begin2++];
			}
		}
		//一下子梭哈
		memcpy(arr, tmp, sizeof(int) * size);
		//调整gap
		gap *= 2;
	}
}

分步拷贝

void MerageSortNonR1_1(int* arr, int size)
{
	int* tmp = (int*)malloc(sizeof(int) * size);
	if (tmp == NULL)
	{
		perror("malloc fail");
		exit(-1);
	}
	int gap = 1;
	while (gap < size)
	{
		for (int i = 0; i < size; i += 2 * gap)
		{
			//归并的两个区间
			int begin1 = i;
			int end1 = i + gap - 1;
			int begin2 = i + gap;
			int end2 = i + 2 * gap - 1;
			//修正越界的部分
			//首先begin1是不可能越界的
			//end1越界与begin2越界
			//直接跳出循环即可
			//end2越界
			//修正end2
			if (end1 >= size||begin2>=size)
			{
				break;
			}
			else if (end2 >= size)
			{
				end2 = size - 1;
			}
			//排序
			int j = i;
			while (begin1 <= end1 && begin2 <= end2)
			{
				if (arr[begin1] <= arr[begin2])
				{
					tmp[j++] = arr[begin1++];
				}
				else
				{
					tmp[j++] = arr[begin2++];
				}
			}
			while (begin1 <= end1)
			{
				tmp[j++] = arr[begin1++];
			}
			while (begin2 <= end2)
			{

				tmp[j++] = arr[begin2++];
			}
			//注意这里end2不能减去begin1+1因为这里的begin1在循环之后已经成为begin1l
			//真正的左区间是i
			memcpy(arr+i, tmp+i, sizeof(int) * (end2-i+1));
		}	
		//调整gap
		gap *= 2;
	}
}

稳定性与时间复杂度

  • 时间复杂度
    在这里插入图片描述
    可以类比快排的理想状态,这里每一层都要排序,排序的次数等于层数。

设节点有N个。层数为h
则:2h = N,
h = log2N
因此时间复杂度为层数乘以每次排序的次数——O(N*logN)

  • 空间复杂度
    递归的空间消耗为——O(logN)
    额外开辟的空间为——O(N)
    因此:空间复杂度为O(N)

  • 稳定性
    在排序 1 12 和 1 2两组有序数组 时,1 2 和 1 2,如果相等则先放左边的,后放右边的,这样相对顺序就不会发生变化,因此归并排序是稳定的。

八.计数排序

在这里插入图片描述

void CountSort(int* arr, int size)
{
	//第一步:找最大最小确定数的范围
	int max = arr[0];
	int min = arr[0];
	//可不敢初始化为0,因为0不一定在数组内部
	for (int i = 0; i < size; i++)
	{
		if (arr[i] > max)
		{
			max = arr[i];
		}

		if (arr[i] < min)
		{
			min = arr[i];
		}
	}
	int range = max - min + 1;
	//假如0到9为最大和最小,则[0,9]一共有9-0+1=10个数
	int* Count = (int*)calloc(range, sizeof(int) * range);
	if (Count == NULL)
	{
		perror("calloc fail");
		exit(-1);
	}
	//下标与数的关系为
	//F =x-min,F是下标,min是最小值,x是数
	//这是可以存负数的!
	//当存的最小值是-9时,下标为-9-(-9)= 0,最小值的下标为0
	for (int i = 0; i < size; i++)
	{
		Count[arr[i] - min]++;
	}
	//将记过的数再拷贝回原数组
	for (int i = 0,j = 0; i < range; i++)
	{
		while (Count[i]--)
		{
			arr[j++] = i + min;
		}
	}
}

复杂度

  • 时间复杂度

最大与最小值相差较小时,且数据比较集中(计数排序有奇效)时,我们可认为时间复杂度为O(N)

在最大值与最小值相差较大时,我们认为时间复杂度为O(N+range),range为最大值与最小值的数据范围

  • 空间复杂度

计数的数组的大小是额外开辟的空间,因此空间复杂度为O(range),range意思同上

  • 稳定性
    由于计数排序不是对原数组进行直接排序,所以稳定性我们不加讨论

九.基数排序

  • 利用逆序数的原理
  • 1.从低位到高位保证有序
  • 2.最后整体保持有序
#define KEY 4//最高位决定了要比较的次数
#define REDIX 10//每位的可能取值为0-9一共十个数,因此为10
void Print(int* arr, int size)
{
	for (int i = 0; i < size; i++)
	{
		printf("%d ", arr[i]);
	}
	printf("\n");
}
int GetNumber(int i, int key)
{
	int val = i;
	int rem = i;
	while (key--)
	{
		val = rem % 10;
		rem /= 10;
	}
	return val;
}
void RedixSort(int* arr, int size)
{
	Queue q[REDIX];
	for (int i = 0; i < REDIX; i++)
	{
		QueueInit(&q[i]);
	}
	//比较的总躺数
	for (int i = 1; i <= KEY; i++)
	{
		//分发数据
		for (int j = 0; j < size; j++)
		{
			//获取位数的值
			int num = GetNumber(arr[j],i);//第i位的值(从右向左)
			QueuePushBack(&q[num], arr[j]);//q[num]是存位数的对列
		}
		//将数据再拷贝回去
		int j = 0;
		for (int n = 0; n < REDIX; n++)
		{
			//将一个对列出空
			while (!QueueEmpty(q[n]))
			{
				int num = QueueTop(q[n]);
				QueuePopFront(&q[n]);
				arr[j++] = num;
			}
		}
	}

	for (int i = 0; i < REDIX; i++)
	{
		QueueDestory(&q[i]);
	}
}
//总结:
//本质上排序的原理是逆序数,从保证个位有序到保证万位有序,从而达到了所有的位数都有序,从而整体有序。
//对列的先进先出,刚好适合分发数据
//这一部分建议走读代码,才能真正理解基数排序!

十.外排序

  • 用途:海量数据的排序。
  • 核心思想:将数据进行分份读取,分份进行排序,然后两两进行归并排序。
  • 图解:

在这里插入图片描述


  • Merge.h
#pragma once
#include<stdio.h>
#include<stdlib.h>
#include<time.h>
#include<string.h>
void MergeSortFile(const char* file_name, int size);
void FileDataWrite(const char* file_name, int nums);
  • Merge.c 文件
#include"Merge.h"
void Swap(int* n1, int* n2)
{
	int tmp = *n1;
	*n1 = *n2;
	*n2 = tmp;
}
void QuickSort(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}
	int key = arr[left];
	int hole = left;
	int begin = left;
	int end = right;
	while (begin < end)
	{
		while (begin < end && arr[end] >= key)
		{
			end--;
		}
		Swap(&arr[end], &arr[hole]);
		hole = end;
		while (begin < end && arr[begin] <= key)
		{
			begin++;
		}
		Swap(&arr[begin], &arr[hole]);
		hole = begin;
	}
	arr[hole] = key;
	//剩余[left,hole-1]与[hole+1,right]
	QuickSort(arr, left, hole - 1);
	QuickSort(arr, hole + 1, right);
}
//先写文本数据,这是用来测试外排序写的,生成随机数进行排序。
void FileDataWrite(const char* file_name, int nums)
{
	FILE* fp = fopen(file_name, "w");
	//以write写如果没有名字就在源文件的目录下创建一个文本文件
	if (fp == NULL)
	{
		perror("fopen fail");
		exit(-1);
	}
	int i = 0;
	for (i = 0; i < nums; i++)
	{
		int tmp = rand() % 100;
		fprintf(fp, "%d\n", tmp);
	}
	fclose(fp);
}
void PartMergeSort(FILE* fp1, FILE* fp2, FILE* fp3)
{
	//一个一个读取,文件指针会自动往后面指向可能会漏读数据
	int num1 = 0;
	int num2 = 0;
	int ret1 = fscanf(fp1, "%d", &num1);
	int ret2 = fscanf(fp2, "%d", &num2);
	while (ret1 != EOF && ret2 != EOF)
	{
		if (num1 <= num2)
		{
			fprintf(fp3, "%d\n", num1);
			//更新ret1和num1
			ret1 = fscanf(fp1, "%d", &num1);
		}
		else
		{
			fprintf(fp3, "%d\n", num2);
			//更新ret2和num2
			ret2 = fscanf(fp2, "%d", &num2);
		}
	}
	//有一个为空时,继续读取
	while (ret1 != EOF)
	{
		fprintf(fp3, "%d\n", num1);
		//更新ret1和num1
		ret1 = fscanf(fp1, "%d", &num1);
	}
	while (ret2 != EOF)
	{
		fprintf(fp3, "%d\n", num2);
		//更新ret2和num2
		ret2 = fscanf(fp1, "%d", &num2);
	}
	fclose(fp3);
}
void CopyDatas(FILE* wfp, FILE* rfp)
{
	int num = 0;
	int ret = fscanf(rfp, "%d", &num);
	while (ret != EOF)
	{
		fprintf(wfp, "%d\n", num);
		ret = fscanf(rfp, "%d", &num);
	}
	fclose(wfp);
	fclose(rfp);
}
void MergeSortFile(const char* file_name, int size)
{
	//一.打开文本数据,将数据分份读取
	FILE* fp = fopen(file_name, "r");
	if (fp == NULL)
	{
		perror("fopen fail");
		exit(-1);
	}
	//将数据分成小份文件
	char file[100];//用来存放起名字的数组
	int  sort[10] = { 0 };//用来存放要排序的数组
	int name = 1;//这是文件的名字的控制
	int file_count = 0;//保存文件开辟的个数
	//一次读取十个数据
	while (1)//直到读完就停止——刚好读取的个数与实际不相同
	{
		//先从要排序的文件中读取10个数据
		int ret = 0;
		int count = 0;//存放成功读取的数据个数
		
		for (int i = 0; i < 10; i++)
		{
			
			ret = fscanf(fp, "%d\n", &sort[i]);
			if (ret == EOF)
			{
				break;
			}
			count++;
		}
		//这里是处理刚好读取完数据也就是i等于0
		if (count == 0)
		{
			break;
		}
		//进行快排
		QuickSort(sort, 0, sizeof(sort) / sizeof(sort[0])-1);
		//将数据再放到小文件中
		sprintf(file, "%d.txt", name++);//起名字
		//将文件名创建
		FILE* fp1 = fopen(file, "w");
		if (fp1 == NULL)
		{
			perror("open fp1 fail");
			exit(-1);
		}
		file_count++;
		//将数据读到已经创建好的文件中
		for (int j = 0; j < count; j++)
		{
			fprintf(fp1, "%d\n", sort[j]);
		}
		//如果读取的数据小于十个并且大于0个那么后面就不用继续读取数据了
		if (count>0&&count<10)
		{
			break;
		}
		fclose(fp1);//关闭文件指针
	}
	fclose(fp);
	//到这里就开始归并排序
	//我们需要创建一个用来放数据的文件,两个文件指针用来读取数据
	char file1[20] = "1.txt";
	char file2[20] = "2.txt";
	char file3[20] = "1";
	int i = 0;
	//还是用file进行起名字
	strcpy(file, "1.txt");
	for (i = 1; i < file_count;)
	{
		//更新file的内容为file1和file2的名字的数字连接
		//将file的内容赋值给file1,file2的名字
		strcpy(file1, file);
		sprintf(file2, "%d.txt", ++i);//这里会对i进行调整
		sprintf(file3, "%s%d", file3, i);
		sprintf(file, "%s.txt", file3);
		FILE* fp1 = fopen(file1, "r");
		if (fp1 == NULL)
		{
			perror("fopen fp1 fail");
			exit(-1);
		}
		FILE* fp2 = fopen(file2, "r");
		if (fp2 == NULL)
		{
			perror("fopen fp2 fail");
			exit(-1);
		}
		FILE* fp3 = fopen(file, "w");
		if (fp3 == NULL)
		{
			perror("fopen fp3 fail");
			exit(-1);
		}
		PartMergeSort(fp1,fp2,fp3);

		fclose(fp1);
		fclose(fp2);
		//删除不需要的文件
		remove(file1);
		remove(file2);
	}
	//将数据再拷贝到文件中
	FILE* fp1 = fopen(file_name, "w");
	if (fp1 == NULL)
	{
		perror("fopen fail");
		exit(-1);
	}
	FILE* fp2 = fopen(file, "r");
	if (fp2 == NULL)
	{
		perror("fopen fail");
		exit(-1);
	}
	CopyDatas(fp1, fp2);
	remove(file);
}
//总结:只有当缓冲区刷新时,数据才会被读取到文件中——fclose
//fprintf是将内存输出到文件
//fscanf是将文件里的内容输人到内存
//sscanf是将指定数据输入到内存
//sprintf是将字符串数据按指定格式读到内存中
  • test.c
#include"Merge.h"

int main()
{
	srand((unsigned int)time(NULL));//设置随机数起点。
	char* file_name = "Datas.txt";
	//FileDataWrite(file_name, 100);//这是我随机安排的100个随机数(1-100)
	MergeSortFile(file_name, 100);
	return 0;
}
  • 18
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值