第七章 排序
7.2 插入排序
7.2.1 算法
基本步骤:在第p趟,将位置p上的元素向左移动至它在前p+1个元素中的正确位置上。
实现代码
/*Simple insertion sort*/
template <typename Comparable>
void insertionSort(vector<Comparable> & a)
{
itn j;
for(int p = 1; p< a.size();p++)
{
Comparable temp ] a[p];
for(j = p; j >0 && temp < a[j - 1]; j--)
a[j] = a[j - 1];
a[j] = temp;
}
}
7.2.2 插入排序的STL实现
接收一对迭代器来代表在某范围内的起始和终止标志。
使用STL介绍的几个观点转换算法的明显的观点是:
- 必须编写一个双参数排序和一个三参数排序的例程。假定双参数排序调用三参数排序,同时使用less()作为第三个参数
- 数组访问必须转换成迭代器访问
- 改变temp类型
/*Simple insertion sort*/
template <typename Iterator>
void insertionSort(const Iterator & begin, const Iterator &end)
{
if(begin != end)
insertionSortHelp(begin, end, *begin);
}
template <typename Iterator>
void insertionSortHelp(const Iterator & begin, const Iterator &end, const Object & obj)
{
insertionSort(begin, end, less<Object>);
}
7.2.3 插入排序的分析
每一个嵌套循环都话费N次迭代,插入排序为O(N2)。
7.3 一些简单排序算法的下界
可以通过计算排列中平均逆序数而得到插入排序平均运行时间的精确的界,假设不存在重复元素,设输入数据是前N个整数的某个排列,得到如下定理
定理7.1 N个互异元素的数组的平均逆序数是N(N-1)/4
定理7.2通过交换相邻元素进行排序的任何算法平均需要Ω(N2)
7.4 谢尔排序
是冲破二次时间屏障的第一批算法之一,通过比较相距一定间隔的元素来工作,直到比较相邻元素的最后一趟为止,也叫做缩减增量排序
使用一个序列h1,h2,…ht叫做增量序列。相当于每次都是一次插入排序。
谢尔排序运行时间依赖于增量序列的选择,Shell建议的序列是二分之一步进。
实现代码如下
/*Shell sort, using shell's increments*/
template <typename Comparable>
void ShellSort(vector<Comparable> & a)
{
for(int gap = a.size()/2);gap >0; gap /= 2)
{
for(int i = gap; i< a.size(); i++)
{
Comparable temp = a[i];
int j =i;
for(; j>= gap && temp < a[j - gap]; j-= gap)
a[j] = a[j- gap];
a[j] = temp;
}
}
}
定理7.3 使用谢尔增量时谢尔排序的最坏情形运行时间为O(N2)
谢尔增量的缺点在于,这些增量未必互素,因此较小的增量可能影响比较小。Hibbard提出来一个稍微不同的增量序列,如同,1,3,7,,,2k-1,相邻的增量没有公因子。
定理7.4使用Hibbard增量的谢尔排序的最坏情形运行时间为O(N3/2)
7.5 堆排序
先建立一个堆,然后每次执行deleteMin操作,得到了N个元素的排序。
定理7.5 堆N个互异项的随机排列进行堆排序,所用的平均次数为2NlogN - O(NloglogN)
7.6归并排序
基本操作是合并两个已经排序的表。
该算法是典型的分治策略,将问题分成一些小的问题然后递归求解,治的阶段是将分的阶段解得的各个答案修补在一起。
归并排序的运行时间是O(NlogN),但是很难用于主存排序,主要问题在于合并两个排序的表需要线性附加内存。运行时间很大程度上依赖于在数组中进行元素的比较和移动所消耗的时间。
7.7 快速排序
事件中最快的一直排序算法,平均运行时间为O(NlogN),通过将堆排序和快速排序结合起来,得到最快运行时间
快速排序也是分治的递归算法,步骤如下
- 如果S中元素个数为0或者1,返回
- 取S中任一个元素v,称之为枢纽元
- 将S-{v}(S中其他元素)划分成两个不相交的集合,一个是x≤v,另一个相反。
- 返回quickSort(S1),后跟v,继续quickSort(S2)
选取枢纽元
1. 一种错误的做法:选取第一个元素,如果元素随机可以接受,但是如果是预排序过的,那么效果很差
2. 一种安全的做法:随机选取枢纽元
3.三数中值分割法:随机选取三个元素并用他们的中值作为枢纽元,一般的做法是使用左端,右端和中心位置的三个。