一. 排序方法
- 快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。
- 分治法的基本思想是:将原问题分解为若干个规模更小但结构与原问题相似的子问题。递归地解这些子问题,然后将这些子问题的解组合为原问题的解。原排序数组data[0...n]。
- 分解:在data[low..high]中任选一个记录作为基准(pivot),以此基准将当前无序区划分为左、右两个较小的子区间data[low..pivotpos-1]和data[pivotpos+1..high],并使左边子区间中所有记录的关键字均小于等于基准记录pivot,右边的子区间中所有记录的关键字均大于等于pivot,而基准记录pivot则位于正确的位置(pivotpos)上,它无须参加后续的排序。
- 递归:data[low..high]被划分为两个子区间data[low..pivotpos-1)和data[pivotpos+1..high],而每个子区间采用相同的方法再次划分为两个子区间...
- 组合:因为当"求解"步骤中的两个递归调用结束时,其左、右两个子区间已有序。对快速排序而言,"组合"步骤无须做什么,可看作是空操作。
二. 动画演示
http://student.zjzk.cn/course_ware/data_structure/web/flashhtml/kuaisupaixu.htm
三.Java代码
- /**
- * 快速排序
- * @param data
- * @param low data最小下标
- * @param high data最大下标
- * @return
- */
- public static int[] quickSort(int[] data, int low, int high) {
- // 对data[low..high]快速排序
- int pivotpos; // 划分后的基准记录的位置
- if (low < high) {// 仅当区间长度大于1时才须排序
- pivotpos = partition(data, low, high); // 对data[low..high]做划分
- quickSort(data, low, pivotpos - 1); // 对左区间递归排序
- quickSort(data, pivotpos + 1, high);// 对右区间递归排序
- }
- return data;
- }
- /**
- * 划分算法,划分后
- * 左边子区间中所有记录的关键字均小于等于基准记录pivot
- * 右边的子区间中所有记录的关键字均大于等于pivot
- * 基准记录pivot则位于正确的位置上 ,即找到pivot在序列中的正确位置
- * @param data
- * @param i
- * @param j
- * @return
- */
- public static int partition(int[] data, int i, int j) {
- // 并返回基准记录的位置
- int pivot = data[i]; // 用区间的第1个记录作为基准 ,
- while (i < j) { // 从区间两端交替向中间扫描,直至i=j为止
- while (i < j && data[j] >= pivot) {
- // pivot相当于在位置i上
- j--; // 从右向左扫描,查找第1个关键字小于pivot的记录data[j]
- }
- if (i < j) // 表示找到的data[j]的关键字<pivot
- data[i++] = data[j]; // 相当于交换data[i]和data[j],交换后i指针加1
- while (i < j && data[i] <= pivot) {
- // pivot相当于在位置j上
- i++; // 从左向右扫描,查找第1个关键字大于pivot的记录data[i]
- }
- if (i < j) // 表示找到了R[i],使data[i]>pivot
- data[j--] = data[i]; // 相当于交换data[i]和data[j],交换后j指针减1
- } // endwhile
- data[i] = pivot; // 基准记录已被最后定位
- return i;
- }
四. 时间复杂度和稳定性
- 最好时间复杂度
- 在最好情况下,每次划分所取的基准都是当前无序区的"中值"记录,划分的结果是基准的左、右两个无序子区间的长度大致相等。总的关键字比较次数:
0(nlogn)
- 在最好情况下,每次划分所取的基准都是当前无序区的"中值"记录,划分的结果是基准的左、右两个无序子区间的长度大致相等。总的关键字比较次数:
- 最坏时间复杂度
- 最坏情况是数组有序时,每次划分选取的基准都是当前无序区中关键字最小(或最大)的记录,划分的结果是基准左边的子区间为空(或右边的子区间为空),而划分所得的另一个非空的子区间中记录数目,仅仅比划分前的无序区中记录个数减少一个。
因此,快速排序必须做n-1次划分,第i次划分开始时区间长度为n-i+1,所需的比较次数为n-i(1≤i≤n-1),故总的比较次数达到最大值:
Cmax = n(n-1)/2=O(n2 )
- 最坏情况是数组有序时,每次划分选取的基准都是当前无序区中关键字最小(或最大)的记录,划分的结果是基准左边的子区间为空(或右边的子区间为空),而划分所得的另一个非空的子区间中记录数目,仅仅比划分前的无序区中记录个数减少一个。
- 平均时间复杂度
- 0(nlogn)
- 算法的空间复杂度:快速排序在系统内部需要一个栈来实现递归。若每次划分较为均匀,则其递归树的高度为O(lgn),故递归后需栈空间为O(lgn)。最坏情况下,递归树的高度为O(n),所需的栈空间为O(n)。
- 快速排序是非稳定的,例如[2,2 ,1]。