主打的就是概念填空题
基本概念
排序码是结点中的一个或多个字段,其值作为排序运算中的依据。排序码可以是关键字或非关键字。不是关键字时,可能有多个结点的排序码具有相同的值, 这时排序结果不唯一。
排序中将结点称为记录,每个记录有一个排序码,将一系列结点构成的线性表称为文件。
排序运算是将文件中的记录按排序码排成非递减(或非递增)序列。
如果一个排序算法对于任意具有相同排序码的多个记录在排序之后,这些具有相同排序码的记录的相对次序仍然保持不变,则称该排序算法是稳定的;否则称该排序算法是不稳定的。
插入排序
直接插入排序
先将第一个记录看作是一个有序的记录序列,然后从第二个记录开始,依次将未排序的记录插入到这个有序的记录序列中去, 直到整个文件中的全部记录排序完毕
在没找到temp应该放的位置之前,遍历找位置时,被遍历到的位置上原来的元素向后移
时间复杂度为O(n^2)
最好情况下比较n-1次
最坏情况下比较n(n-1)/2次
直接插入排序是稳定的
优点:最好情况O(n)
折半插入排序
折半排序算法:在已经排序的A[0 : i-1]里为 A[i]寻找插入位置(可能的插入位置包括 0,1,2,…,i)。 将A[i]与A[m=(i-1)/2] 比较,若A[i]<A[m]则 在A[0 : m-1]里寻找插入位置(可能的插入位置包括0,…,m) ;否则在A[m+1 : i-1]里 寻找插入位置(可能的插入位置包括 m+1,…,i) 。先和中间值比较,再判断是在前面还是后面找,并且下一次寻找也是同样的方法,一次比较可排除一半可能的插入点。
k是头,r是尾,该函数可以找到插入点
折半插入排序的时间复杂度分析
时间复杂度为O(nlogn)
最好情况下移动2n次
最坏情况下移动n^2/2次
折半插入排序是稳定的
优点:稳定
shell排序
把待排序的n个记录分成si个组,距离为si的记录为一个组,对每一组进行排序。si逐渐变小并重复。
Shell排序的基本思想:先选定一个整数s1<n, 例如s1=n/2,把待排序的n个记录分成s1个组, 所有距离为s1的记录为一个组,对每一组进 行排序。然后取s2<s1,重复上述分组和排序。当达到si=1时,所有记录排好序。
各组内通常用直接插入排序,开始时si值较大,各组记录数少,所以排序较快,si值增大时,由于已经按si-1排好序,排序速度也较快。组内也可以用其他排序方法,但不能用折半插入。
一般来说shell快于直接插入
平均比较次数和平均移动次数为O(n^1.3),最坏情况时间开销O(n^(3/2))
Shell排序是不稳定的。
优点:时效性好
选择排序
直接选择排序
直接选择排序:每次从A[i : n-1]中选出排序 码最小的记录A[k],放在已排序的记录A[0 : i-1]的后面(交换A[i]与A[k])。i从0到n-1执行该步骤。
直接插入是在排序好的里边比较,直接选择是在没排序的里面比较找到最小的直接放到排序好的里的,所有从0 开始
直接选择排序总的比较次数为
最好情况下,待排序记录已按非递减排好序,此时移动次数为0次;
最坏情况下待排序记录已按非递增序排好,此时的移动次数为3(n-1)。
直接选择排序是不稳定的
优点:可以生成有意义的中间结果
树形选择排序
树形选择排序的基本思想:把待排序的n个记录的排序码两两进行比较,取出┌n/2 ┐个 较小的排序码作为作为结果保存下来, 这 ┌n/2┐个排序码进一步两两进行比较,重复上述过程直到得到最小的排序码
总共需要n-1次选择
第1次选择进行n-1次比较
第2次-第n-1次选择每次需要┌logn ┐次比 较
总的比较次数为 n-1+(n-2) ┌logn ┐≈n·logn
总时间开销为O(nlogn)
优点:时效性不错(空间换时间)
交换排序
冒泡排序
先比较A[0]和A[1] ,如A[0].key>A[1].key, 则将两个记录交换。然后类似地比较交换 A[1]和A[2],A[2]和A[3],. . . ,直到A[n-2] 和A[n-1]进行比较交换,这称为一趟冒泡。 一趟冒泡后,最大的数被放到A[n-1]。然后, 对前n-1个数进行一趟冒泡,则具有第2大的 数被放到A[n-2]。重复以上过程,第k趟冒 泡将第k大的数放到A[n-k],经n-1趟冒泡后 n个记录中有n-1个数被排好,相当于全部n 个记录排好
概念无所谓,直接看例子比较清楚
注意代码标红可能考,flag的作用是判断是否需要继续排序
最好情况下,n个记录已经按非递减排好序,此时只需要一趟冒泡,比较次数为n-1次,移动次数为0次。
最坏情况下, n个记录已经按非递增排好序,此时需要n-1趟冒泡,比较次数和移动次数分别为 冒泡排序是稳定的。
快速排序
从待排序记录中任选一个记录,以这个记录的排序码作为中心值,将其它记录划分为两个部分, 第一部分包含所有排序码小于等于中心值的记录, 第二部分包含所有排序码大于中心值的记录。第 一部分放在该记录的前面,第二部分放在该记录 的后面。对这两个部分采用同样的方法进行处理, 直到每个部分为空或只含一个记录为止。
设i=low; j=high; temp=A[i]=28
从右往左,找 j 放到 i
从左往右,找 i 放到 j
当i==j时,i放入temp
用temp分成两部分继续
代码如上,可能考
最好情况下每次选取的中心值恰好将其它记录分成大小相等(或相差一个记录)的两个部分,第1遍时,经过大约n次(实际上为n-1次) 比较,产生两个大小约为n/2的子文件;第2 遍对每个子文件经过约n/2次比较产生4个大 小约为n/4的子文件,比较次数约为2*(n/2) 次;... n/1+2(n/2)+4(n/4)+...+n(n/n)=nlogn
最坏情况下,待排序文件已经排好序 (n-1)+(n-2)+(n-3)+...+1=n(n-1)/2
快速排序是不稳定的
分配排序
基数排序
最低位优先:从低位往高位进行分配和收集
最高位优先:从高位往低位进行分配和收集
例子
如果采用链式存储结构,将移动记录改为修改指针,则可克服时间和空间消耗问题
复杂性分析
基数排序是稳定的
归并排序
就是两两合并
一个文件是部分排序的是指该文件划分成若干子文件后,每个子文件是已经排序的。当待排序的文件已经是部分排序时,将已经排序的子文件每两个进行归并,如此反复,最后得到完全排序的文件。
含有n个记录的待排序文件,开始可以划分 为n个已排序的子文件
两组归并
一趟两组归并
归并排序
复杂性分析
对n个记录进行归并排序,需要调用函数 OnePassMerge约logn次,OnePassMerge的时间复杂性为O(n),最后可能执行n次移动,总的时 间复杂性为O(n*logn)。需要n个附加存储空间
归并排序是稳定的
总结
害的看书,书上的知识真香