【说明】博客内容选自课件内容
目录
一. 直接插入排序(基于顺序查找)“在R[1..i-1]中查找R[i]的插入位置”
一、什么是排序?
排序是计算机内经常进行的一种操作,其目的是将一组“无序”的记录序列调整为“有序”的记录序列。
一般情况下,假设含n个记录的序列为{ R1, R2, …, Rn }其相应的关键字序列为 { K1, K2, …,Kn }
这些关键字相互之间可以进行比较,即在它们之间存在着这样一个关系Kp1≤Kp2≤…≤Kpn
按此固有关系将上式记录序列重新排列为 { Rp1, Rp2, …,Rpn }
的操作称作排序。
二、排序方法的稳定性能
稳定的排序方法指的是,对于两个关键字相等的记录,它们在序列中的相对位置,在排序之前和经过排序之后,没有改变。
排序之前 : { · · · · · Ri(K) · · · · · Rj(K) · · · · · }
排序之后 : { · · · · · Ri(K) Rj(K) · · · · ·· · · · · }
如果排序之后 : { · · · · · Rj(K) Ri(K) · · · · ·· · · · · }则不稳定!
三、内部排序和外部排序
若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序;
反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中完成,则称此类排序问题为外部排序
四. 内部排序方法分类
按照排序过程所需要的工作量来分类:
简单排序:O(n2)
高级排序:O(n×logn)
基数排序:O(d ×n)
基于不同的“扩大” 有序序列长度的方法,内部排序大致可分下列几种类型:
插入类 交换类 选择类 归并类 其它方法
1. 插入类:将无序子序列中的一个或几个记录“插入”到有序序列中,从而增加记录的有序子序列的长度。
2. 选择类:从记录的无序子序列中“选择”关键字最小或最大的记录,并将它加入到有序子序列中,从而增加记录的有序子序列的长度。
3. 交换类:通过“交换”无序序列中的记录从而得到其中关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。
4. 归并类:通过“归并”两个或两个以上的记录有序子序列,逐步增加记录有序序列的长度。
插 入 排 序
一趟插入排序的基本思想:
实现“一趟插入排序”可分三步进行:
(1).在R[1..i-1]中查找R[i]的插入位置;R[1..j].key <= R[i].key < R[j+1..i-1].key
(2).将R[j+1..i-1]中的所有记录均后移一个位置;
(3).将R[i] 插入(复制)到R[j+1]的位置上。
各种插入算法:
一. 直接插入排序(基于顺序查找)“在R[1..i-1]中查找R[i]的插入位置”
算法的实现要点:分四个步骤执行
1.从R[i-1]起向前进行顺序查找,
2.对于在查找过程中找到的那些关键字不小于R[i].key的记录,在查找的同时实现记录向后移动;
3. 上述循环结束后可以直接进行“插入”
4. 令 i = 2,3,…, n,实现整个序列的排序。
void InsertionSort ( SqList &L ) {
// 对顺序表 L 作直接插入排序。
for ( i=1+1; i<=L.length; i=i+1 )
L.r[0] = L.r[i]; // 复制为监视哨兵
for ( j=i-1; L.r[0].key < L.r[j].key; j=j-1 )
L.r[j+1] = L.r[j]; // 记录后移
L.r[j+1] = L.r[0]; // 插入到正确位置
} // InsertSort
内部排序的时间分析:
实现内部排序的基本操作有两个:
(1)“比较”序列中两个关键字的 大小;(2)“移动”记录。
最坏的情况下比较次数依次为n, n-1, ..., 2
二. 折半插入排序(基于折半查找)
因为 R[1..i-1] 是一个按关键字有序
的有序序列,则可以利用折半查找实现“在R[1..i-1]中查找R[i]的插入位置”,
如此实现的插入排序为折半插入排序.
平均比较次数: nlog2n
平均比较次数: nlog2n 平均移动次数: n2/4 时间复杂度: O(n2)
三. 2路插入排序(基于折半查找)没怎么看懂???
在折半的基础上再改进,目的是减少排序过程中移动记录的次数,但需要增加包含n个记录的辅助空间。
1). 设一个与待排序表L.r同类型的数组d;
2). 令d[1]=L.r[1],将d[1]看成已经排好序的序列的中间位置;
3). 从L.r中的第2个位置起,将记录依次与d[1]进行比较,比d[1]大则插入d[1]之前的序列中,否则插入d[1]之后;
4). 将数组d看成一个双向循环表,设两个动态指针,first指向d[1]之前最小的记录,final指向d[1]之后最大的记录。
5). 依次处理L.r中的所有记录。
(个人想法)
感觉这个二路插入比折半插入优化的地方在于当待插入元素在和d[1]比较完之后,他不需要和之前的所有有序序列中进行折半查找,而只需要根据比较的结果比如大于或者小于只在final所指的元素左侧和first所指的元素右侧进行就好了,所以他的平均移动次数是折半插入移动次数的一半!!!
移动次数约为: n^2/8 当L.r[1]是最小或最大时失去优越性 时间复杂度:O(n2)
四. 表插入排序(基于链表存储)
为了减少在排序过程中的“移动” 操作,必须改变排序过程中采用的存储结构。利用静态链表进行排序,并在排序完成之后,一次性地调整各个记录相互之间的位置,即将每个记录都调整到它们所应该在的位置上。
两个问题:1. 如何在静态链表上排序? 2. 如何在排序之后调整记录序列?
移动次数:0 比较次数与直接插入相同。 平均比较次数:O(n2) 时间复杂度:O(n2)
3. 如何在排序之后调整记录序列?
调整的原则是:排序后链表中的第 i 个结点应该是排序后数组中的第 i 个分量;
设排序后第 i 个最小关键字的结点在数组中的下标为 p,
如果 p> i,则先保持SL.r[p]的指针到 q ( q为p的下一个结点),然后互换SL.r[i]和SL.r[p],且令SL.r[i]的指针域指向p。
如果p< i,则应顺链表继续查找到p≥i为止。
五. 希尔排序(基于逐趟缩小增量)
基本思想:对待排记录序列先作“宏观”调整,再作“微观”调整。
所谓“宏观”调整,指的是,“跳跃式”的插入排序。具体做法为:
将记录序列分成若干子序列,分别对每个子序列进行插入排序。
例如:将 n 个记录分成 d 个子序列:
{ R[1],R[1+d],R[1+2d],…,R[1+kd] }
{ R[2],R[2+d],R[2+2d],…,R[2+kd] }
…
{ R[d],R[2d],R[3d],…,R[kd],R[(k+1)d] }
其中,d 称为增量,它的值在排序过程中从大到小逐渐缩小,直至最后一趟排序减为 1。