内部排序算法小结

排序算法大体上可分为内部排序和外部排序。所谓外部排序,就是指计算机的内存有限,不能将庞大的序列全部加载到内存中进行排序,就需要访问外部存储设备来进行排序。内部排序,当数据量不是非常大时,可以一次性加载到内存中进行排序的统称。

按照排序依据的不同原则,可将内部排序算法分为插入排序、交换排序、选择排序、归并排序和基数排序。下面我主要讲各种排序算法的原理,实现由小到大的排序,具体的实现方式可以参见我的github:https://github.com/clarkzhang56/the-method-of-sort

插入排序(insert sort)

                插入排序是比较常见的排序方式,主要有直接插入排序希尔排序

               直接插入排序比较简单,实现代码也很短。其原理就是依次遍历整个序列,当该值小于其前一位的值时,就将前一位的值给予该值,并循环比较与更前一位的大小,直到条件不能满足。当序列遍历完时,序列就按照由小到大依次排列了。

               希尔排序相对直接插入排序来讲,就比较麻烦了。设定序列为a[],长度为n,将步长step定为n/2,遍历序列,比较a[i]与a[i+step]的大小,后者小的话就交换位置,并循环比较a[i-step]与a[i],这样进行了第一遍的遍历。接下来将step再减半,循环进行上述操作,直到最后step为0,循环结束,此排序方法的核心就是循环比较值与其相隔step步长值进行比较,代码如下:

for(int i=step; i<n; i++){
       int j= i-step;
       int base= a[i];
       while(j>=0 && a[j]>base){
         a[j+step]= a[j];
         j-= step;
       }
       a[j+step] = base;
}

交换排序(exchange sort)

               交换排序主要有大家比较常见的冒泡排序和效率比较高的快速排序了。

              冒泡排序,顾名思义,就是依次遍历,将比较“冒泡”的比较大的值排到后面去,所以遍历一次排序后最大的值就被排到了最后。再遍历依次,剩余最大的就被拍到了此时序列的最后,循环遍历直到最后一个值就OK了。

               快排是运行时间复杂度比较小的排序方法。快排的思想就是将序列分成两部分,第一部分是值全部比序列第一个值a[0]小的,第二部分是值全部不比a[0]小的。之后递归上述两部分,最后的时候,就可将序列拍好序了。有一个比较巧的方法,其核心如下所示:

int base=a[low];
while(low<high){
	while( low<high && base<a[high]) high--;
	a[low] = a[hight];
	while( low<high && base>=a[low]) low++;
	a[high] = a[low];
}
a[low] = base;

选择排序 (select sort)

                选择排序有直接选择排序堆排序

直接选择排序,顾名思义,就是选择序列中a[0]后面最小的值,和a[0]交换,然后循环选择序列中a[1]后面最小的值,和a[1]交换,直到最后循环完毕,序列也就排好了。

堆排序稍微复杂点。堆,这里指的是大根堆的完全二叉树。所谓大根堆,是指完全二叉树中所有的子节点都不能大于父节点。堆排序主要分为两个部分:part1,将序列调整成大根堆;part2,将大根堆的根节点和最后一个叶子节点交换,如此一来,序列中最大的值就被拍到了最后,然后循环part1和part2,直到最后剩一个根节点,就将序列排列好了。核心代码如下:

void heap_adjust(int *a, int n){
	int i;
	for(i=0; i<=(n-1)/2; i++){
		int j = i;
		int flag = 0;
		while(j>=0 && 2*j+1<n && flag<2){ //用flag是为了避免j=0时跳入无限循环,但flag存在为1时的可能性
			int k;
			if(2*j+2<n && a[2*j+2]>a[2*j+1]) k = 2*j+2; //选择大的那个子节点和父节点进行比较
			else k = 2*j+1;
			if(a[k]>a[j]){
				int tmp = a[j];
				a[j] = a[k];
				a[k] = tmp;
			}
			j = (j-1)/2;
			if(j==0) flag++;
		}
	}
}
void heap_sort(int *a, int n){
	for(; n>1; n--){
		heap_adjust(a, n);
		int tmp = a[0];
		a[0] = a[n-1];
		a[n-1] = tmp;
	}
}

归并排序(merge sort)

归并排序是指将两个或多个已经排好的序列合并成一个序列。该算法的原理也比较简单,在外部排序的时候必须要用到。依次比较两个序列的最小值,将更小的赋值给新序列直到两个序列的末端。

基数排序(分布式排序)

基数排序,又称桶排序,不同于上述所有的排序方法,基数排序不需要进行序列中数的比较,实现排序主要是通过关键字的比较和移动记录这两种操作。比较数值时是将序列中的值分别放入0~9的十个桶中。放置的原理就是首先比较个分位,将该值放入相应的桶中,然后依次比较上述桶中值的十分位,再放入对应的0~9桶中,直到比较完序列中的最高位为止(这里采用最低位优先的方法,即LSD)。当有的数没有高位时,就置为0,比如数字“9”,其十分位就为0。基数排序其实不太适合比较序列为数值时的情况,其比较适合比较序列为时间、字符串时候的情况,比较字符串时将不足长度的字符串末尾置0。比较数值时,其核心代码如下:

void radix_sort(int *a, int n, int max){//a为数组,n为数组长度,max为数组最高位数
	int num = 0;
	for(; num<max; num++){
		int b[10][MAXSIZE] = {};   //MAXSIZE为自定义的一个数字,大于n就行
		int i,j,k = 0;
		for(i=0; i<n; i++){
			j = ((int)(a[i]/(pow(10,num))))%10;
			for(k=0; k<n; k++){
				if(b[j][k] == NULL) b[j][k] = a[i];
				break;
			}
		}
		int m = 0;
		for(i=0; i<10; i++){<span style="white-space:pre">		</span>//放入桶中后,再把数组重新串起来,方便再放入桶中
			for(j=0; j<n; j++){
				if(b[i][j]!=NULL){
					a[m] = b[i][j];
					m++;
				}
			}
		}
	}
}
各方法比较讨论:

从平均时间性能而言,快速排序最佳,其所需时间 最短。但是快速排序最坏情况下的时间性能不如堆排序和归并排序。直接插入排序适合记录“基本有序”或n较小时,因此其可以和快排、归并排序结合在一起使用。 基数排序适用于n值很大而关键字较小的序列。 排序算法的稳定性,假定待排序的序列中,存在多个具有相同关键字的记录,经过排序后,这些记录相对次序保存不变,则称这中排序算法是稳定的,否则不稳定。上述排序算法中,基数排序是稳定的,时间复杂度为O(n2)的直接插入排序、冒泡、直接选择排序也是稳定的,而时间性能较好的快排、堆排序和希尔排序都是不稳定的。

总的来说,没有哪一个排序算法是绝对的最好或性能最佳,它们的适用场景也不同,有的适合n较小,有的适合n较大,在实际使用时可根据情况选择,必要时可以结合使用。内部排序中,用“比较”进行排序的算法在最坏情况下能达到的最好的时间复杂度为O(nlogn)。

 

1.实验目的 掌握内排序,比较各种排序的优、缺点。 2 需求分析 2.1原理 2.1.1、直接排序 算法描述:经过i-1遍处理后,L[1..i-1]己排好序。第i遍处理仅将L[i]插入L[1..i-1]的适当位置,使得L[1..i]又是排好序的序列。要达到这个目的,我们可以用顺序比较的方法。首先比较L[i]和L[i-1],如果L[i-1]≤ L[i],则L[1..i]已排好序,第i遍处理就结束了;否则交换L[i]与L[i-1]的位置,继续比较L[i-1]和L[i-2],直到找到某一个位置j(1≤j≤i-1),使得L[j] ≤L[j+1]时为止。 2.1.2、冒泡排序 算法描述:核心思想是扫描数据清单,寻找出现乱序的两个相邻的项目。当找到这两个项目后,交换项目的位置然后继续扫描。重复上面的操作直到所有的项目都按顺序排好。 2.1.3、快速排序 算法描述:首先检查数据列表中的数据数,如果小于两个,则直接退出程序。如果有超过两个以上的数据,就选择一个分割点将数据分成两个部分,小于分割点的数据放在一组,其余的放在另一组,然后分别对两组数据排序。通常分割点的数据是随机选取的。这样无论你的数据是否已被排列过,你所分割成的两个字列表的大小是差不多的。而只要两个子列表的大小差不多。 2.1.4、选择排序 算法描述:首先找到数据清单中的最小的数据,然后将这个数据同第一个数据交换位置;接下来找第二小的数据,再将其同第二个数据交换位置,以此类推。 2.1.5、堆排序 (1) 基本思想:堆排序是一树形选择排序,在排序过程中,将R[1..N]看成是一颗完全二叉树的顺序存储结构,利用完全二叉树中双亲结点和孩子结点之间的内在关系来选择最小的元素。 (2) 堆的定义: N个元素的序列K1,K2,K3,...,Kn.称为堆,当且仅当该序列满足特性: Ki≤K2i Ki ≤K2i+1(1≤ I≤ [N/2]) 2.1.6、希尔排序 算法描述:在直接插入排序算法中,每次插入一个数,使有序序列只增加1个节点,并且对插入下一个数没有提供任何帮助。如果比较相隔较远距离(称为增量)的数,使得数移动时能跨过多个元素,则进行一次比较就可能消除多个元素交换。 2.2要求 1.本程序对以下六种常用内部排序算法进行实测比较:冒泡排序,插入排序,选择排序,希尔排序,快速排序,堆排序。 2.排序的元素的关键字为整数。用正序,逆序,不同乱序的数据作测试比较。比较的指标为有关键字参加的比较次数和关键字的移动次数。 3.程序以人机对话的形式进行,每次测试完毕显示各种比较指标值 。 2.3任务 设计一个测试程序比较几种内部排序算法的关键字比较次数和移动次数以取得直观感受。 2.4运行环境 (1)WINDOWSXP系统 (2)C++ 编译环境 3.实验方法 本实验主要是内排序,通过比较的次数和移动的次数判断排序的好坏。主要子函数的说明如下。 1.简单选择排序XuanzePaixu(); 2.冒泡排序MaopaoPaixu(); 3. 直接插入排序CharuPaixu(); 4. 快速排序KuaisuPaixu(); 5. 堆排序DuiPaixu(); 6. 希尔排序 XierPaixu(); 以上的排序算法均采用书中所用的算法。程序采用输入的时候仅输入所要的个数,具体的输入数据由程序随机产生个数,并且输出。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值