看了几页书,大概总结一下。
快速排序是平均状况下性能最为良好的排序算法,时间复杂度(平均情况)为o(nlogn)。但是最坏情况下也会达到o(n^2),也就是说,当待排序的序列是完全有序的时候,快速排序递归就会达到最高代价。所以如果比较担心最还情况,或者要保证最坏情况的时间复杂度,那么最好选用对排序,而不是快速排序。
改进快速排序有几个方面:
1。中枢值的选取。
这个很显然,如果每次都选中实际大小中中间的那个值,那么就能达到最优的排序效果,也是最快的,就是o(nlogn),简单的过程可以理解为在一棵完全平衡二叉树找叶子节点。所以一般的改进方法都是k中枢值法,也就是说在所有数字中随即选择k个中枢值,然后选择中间大小的那个值当作中枢值。k不宜太大,因为会带来额外的消耗。左翼一般情况下k=3。
2。划分的最小数列长度
因为快速排序是对自序列不停递归的一个过程(分治法)。所以如果递归的过多,堆栈带来的性能损失也是不容小视的。还有最重要的一点就是在数据量很小的情况下,插入排序在时间上的性能要比快速排序的性能要好。所以在快速排序进行递归的过程中,如果在序列比较短的时候调用插入排序而不是快速排序,那么性能就会有所提高。具体序列长度为多少时改为插入排序要根据具体的机器和数据而定。
3。栈的深度。
有一点不是很理解:要优先对小的数组进行排序,这样可以减少栈的深度。(有明白的可以解释一下)。。。
有一种算法叫做内观排序:具体思路是,对数据进行快速排序,但是当运行栈的深度达到一定值时就改用堆排序。介绍的不多,但是可以减少由于堆栈带来的性能损耗。
以上三点综合利用大概可以提高原本快速排序20%-30%的性能。