插入排序对于少量元素的排序较为有效。如n <= 15.
稳定
空间复杂度O(1)
时间复杂度O(n2)
最差情况:反序,需要移动n*(n-1)/2个元素
最好情况:正序,不需要移动元素
类似于多人排序一手扑克牌,开始时,我们左手为空且桌子上的牌面向下,然后我们每次从桌上拿一张牌插入左手上正确的位置,我们从右到左将它与已在手中的牌进行比较,拿在左手的牌总是排序好的,原来这些牌是桌子上牌堆中顶部的牌。
图 2-1
下面来写伪代码INSERTION-SORT,参数是一个数组A[1..n],长度为n,用A.lenth来表示。该算法排序输入的数:算法在数组A中重排这些数,在任何时候,最多只有其中常数个数字存储在数组外面,在过程INSERTION-SORT结束时,输入数组A包含排序好的输出序列。
INSERTION-SORT(A)
for j = 2 to A.lenth
key = A[j]
//Insert A[j] into the sored sequence A[1..j-i].
i = j - i
while i >0 and A[i] >key
A[i +1] = A[i]
i = i - 1
A[i + 1] =key
图2-2表明对A = [5,2,4,6,1,3]。该算法如何工作。下标j指出正被插入到手中的“当前牌”,在for循环的每次迭代的开始,包含元素A[1..j-i]的子数组构成了当前排序好的左手中的牌,剩余的子数组A[j+1..n]对应于仍在桌子上的牌堆。事实上元素A[1..j-1]就是原来在位置1到j-1的元素,现在已按序排列。我们把A[1..j-1]的这些性质 形式的表示为一个
循环不变式。
图 2-2
循环不变式主要用来理解算法的正确性。关于循环不变式我们必须证明三条性质:
初始化:循环的第一次迭代之前,它为真。
保持:如果循环的某次迭代之前它为真,那么下次迭代之前它仍为真。
终止:在循环终止时,不变式为我们提供了一个有用的性质,该性质有助于证明算法的正确性。
这个类似于数学归纳法。f(1),f(n-1),f(n)。
初始化: A[1]只有一个元素,是排序好的,成立。
保持: for循环中第4~7行将A[j-1]A[j-2]A[j-3]等向右移一个位置,直到找到A[j]的适当位置第8行将A[j]的值插入到该位置。这时子数组A[1..j]有原来A[1..j]中的元素组成,单已按序排列。成立
终止: 最后研究在循环终止时发生了什么。导致循环终止的条件是j>A.length = n。因为每次迭代j增加1,那么必有j=n+1.在循环不变式的表述中将j用n+1替换,我们有:子数组A[1..n]由原来在A[1..n]中的元素组成,但已按序排序。因此算法正确。
伪代码的约定:
--缩进表示块结构。
--while、for、repeat-unti等循环结构以及if-else等条件结构与C、C++、java、Python和Pascal中的那些结构具有类似的解释。不像某些c++、java和pascal中的情况,在本算法章节中的情况,退出循环后,循环计数器保持其值。因此紧接在一个for循环后,循环计数器的值就是第一个超出for循环界限的那个值。本例中循环终止时j=A.lenth+1,当for循环迭加时用to,迭减时用downto。当循环计数器以大于1的改变时,该改变量跟在可选关键词by之后。
--“//”后面部分是注释。
--形如i=j=e的多重赋值将表达式e的值赋给变量i和j;等价于j=e后跟i=j;
--变量(i、j、key)是局部的给定过程的。若无显式说明,我们不使用全局变量。
--数组元素通过“数组名[下标]”的形式访问。记号“..”用于表示数组中值得一个范围。
--复合数据通常被组织成 对象,对象由 属性组成。如A.length,我们把表示一个数组或对象的变量看做指向表示数组或对象的数据的一个指针。对于某个对象x的所有属性f,赋值y=x导致y.x等于x.y。换句话说在赋值x=y后x和y指向相同的对象。我们的属性记号可以“串联”。如果y=x.y,那么x.f.g与y.g相同--我们按值把参数传给过程:被调用过程接收其参数自身的副本。如x=y对调用过程是不可见的,然而x.y=3却是可见的。类似的,数组通过指针来传递,结果指向数组的一个指针被传递,而不是整个数组,单个数组的元素的改变对调用过程是可见的。
--一个return语句立即将控制返回到调用过程的调用点。大多数return语句也将一个值传递回调用者,我们的伪代码允许在单一的return语句返回多个值
--布尔运算符“and”和“or”都是短路的。如“x and y”,首先求x,如果x为FALSE,那么表达式不可能为TRUE,所以不再求y。如“x != NIL and x.f=y”,我们不必担心当x = NIL时我们试图求值x.f将会发生什么情况。
--error表示一被调用的过程情况不对而出现一个错误。调用过程负责处理该错误,所以我们不用说明将采取什么行动。
C语言:
#include<stdio.h>
#define MAX 8
int main(void)
{
int a[MAX]={8,7,6,5,4,3,2,1};
int i;
void insert(int*a,int n);//函数声明
insert(a,MAX);
printf("after:\n");
for(i=0;i<8;i++)
{
printf("%d ",a[i]);
}
printf("\n");
return 0;
}
void insert(int *a,int n)
{
int i,j,key;
for(i=1;i<n;i++)//控制需要插入的元素
{
key=a[i]; //key为要插入的元素
for(j=i;j>0 && a[j-1]>key;j--) //查找要插入的位置,循环结束,则找到插入位置
{
a[j] = a[j-1]; //移动元素的位置.供要插入元素使用
}
a[j] = key; //插入需要插入的元素
}
}
优化:
void Insertsort3(int a[], int n)
{
int i, j;
for (i = 1; i < n; i++)
for (j = i - 1; j >= 0 && a[j] > a[j + 1]; j--)
Swap(a[j], a[j + 1]);
}
python:
#!/usr/bin/python
def insert_sort(array):
for i in range(1, len(array)):
key = array[i]
j = i - 1
while j >= 0 and key < array[j]:
array[j + 1] = array[j]
j-=1
array[j + 1] = key
if __name__ == "__main__":
array = [2, 4, 32, 64, 34, 78, 23, 2345, 2345, 12, 1, 3]
insert_sort(array)
for a in array:
print a
java:
public class InsertSortTest {
public static void insertSort(int[] array) {
if (array == null || array.length < 2) {
return;
}
for (int i = 1; i < array.length; i++) {
int currentValue = array[i];
int position = i;
for (int j = i - 1; j >= 0; j--) {
if (array[j] > currentValue) {
array[j + 1] = array[j];
position -= 1;
} else {
break;
}
}
array[position] = currentValue;
}
}
public static void main(String[] args) {
int[] array = { 3, -1, 0, -8, 2, 1 };
ArrayUtils.printArray(array);
insertSort(array);
ArrayUtils.printArray(array);
}
}
其他语言以后再补。