·1.排序的概念及其运用
·2.常见排序算法的实现
·3.排序算法复杂度及稳定性分析
1.排序的概念及其运用
1.1排序的概念
排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。
内部排序:数据元素全部放在内存中的排序。
外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。
1.2排序运用
1.3 常见的排序算法
2.常见排序算法的实现
2.1 插入排序
2.1.1基本思想:
直接插入排序是一种简单的插入排序法,其基本思想是:把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。
实际中我们玩扑克牌时,就用了插入排序的思想:
2.1.2直接插入排序:
当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将array[i]插入,原来位置上的元素顺序后移。
直接插入排序的特性总结:
1. 元素集合越接近有序,直接插入排序算法的时间效率越高
2. 时间复杂度:O(N^2) 最好的情况:O(N)--顺序有序,最坏的情况:O(N^2)--逆序
3. 空间复杂度:O(1),它是一种稳定的排序算法
4. 稳定性:稳定
2.1.3 希尔排序( 缩小增量排序 )
希尔排序法又称缩小增量法。希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序。
假设gap=3时我们首先套用两层循环来预排看一看效果:
采用多组并排的方式:
希尔排序的特性总结:
1. 希尔排序是对直接插入排序的优化。
2. 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。
3. 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些树中给出的希尔排序的时间复杂度都不固定。时间复杂度:O(N^1.3)
4. 稳定性:不稳定 (相同的值可能被分到了不同的组里,稳定性无法保证)
2.2 选择排序
2.2.1基本思想:每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完 。
2.2.2 直接选择排序:
·在元素集合array[i]--array[n-1]中选择关键码最大(小)的数据元素
·若它不是这组元素中的最后一个(第一个)元素,则将它与这组元素中的最后一个(第一个)元素交·换在剩余的array[i]--array[n-2](array[i+1]--array[n-1])集合中,重复上述步骤,直到集合剩余1个元素
代码实现:
直接选择排序的特性总结:
1. 直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用
2. 时间复杂度:O(N^2)
3. 空间复杂度:O(1)
4. 稳定性:不稳定
2.2.3 堆排序
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。
堆排序的特性总结:
1. 堆排序使用堆来选数,效率就高了很多。
2. 时间复杂度:O(N*logN)
3. 空间复杂度:O(1)
4. 稳定性:不稳定
2.3 交换排序
基本思想:所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置,交换排序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动。
2.3.1冒泡排序
冒泡排序的特性总结:
1. 冒泡排序是一种非常容易理解的排序
2. 时间复杂度:O(N^2)
3. 空间复杂度:O(1)
4. 稳定性:稳定
2.3.2 快速排序
快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。
上述为快速排序递归实现的主框架,发现与二叉树前序遍历规则非常像,在写递归框架时可想想二叉树前序遍历规则即可快速写出来,后续只需分析如何按照基准值来对区间中数据进行划分的方式即可。
1. hoare版本
递归流程:
如何解决快排面对有序的选key问题:
1.随机选key
2.三数取中,三数:最左边,中间,最右边 取不是最大也不是最小的那个作key,即此三数中位数
利用三数取中就不会出现栈溢出的问题:在这里合理地处理了性能问题,面对有序的情况下,使时间复杂度变成了O(N*logN).
递归程序缺陷:
1.相对循环程序,性能差一点(针对早期编译器是这样的,因为对于递归调用,建立栈帧优化不大,现在新的编译器优化都很好,递归相比循环性能差不了多少),所以已经不是主要矛盾。
2.递归深度太深,会导致栈溢出。
快速排序的特性总结:
1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序
2. 时间复杂度:O(N*logN)
3. 空间复杂度:O(logN)
4. 稳定性:不稳定
2. 挖坑法
3. 前后指针版本
执行方法一:
执行方法二:
实现代码一:
实现代码二:
2.3.2 快速排序优化
1. 三数取中法选key:三数:最左边,中间,最右边 取不是最大也不是最小的那个作key,即此三数中位数
2. 递归到小的子区间时,可以考虑使用插入排序
2.3.2 快速排序非递归
2.4 归并排序
基本思想:
归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
归并排序核心步骤:
此题的思路非常精巧,首先我们应该把这个想象成一个二叉树,类似于一个后序遍历,先递归过后再归并,也就是要去递归遍历一下,递归遍历的时候要注意,当被分为单独一个时,即return,然后,两个一组被返回时我们执行下面的比较合并程序,比如:10和6,执行完首先合并比较一下改变这两个数的顺序,这一步执行完成后再去持续进行四个数的合并,最后再执行八个数的合并。最后合并完成后再将tmp赋值给a原数组.
if函数里面的a[begin1]<a[begin2]设计思路,这里要放大来思考:
这里设计三个while函数的想法:第一个while函数里面用的是&&,为什么这样使用呢?
因为当任何一个数组到了末尾时即结束第一个while程序 。
第二个while程序和第三个while程序就是用来判断是谁先结束,如果任何一个先结束了,那么把剩下的赋值进去即可。
归并排序的特性总结:
1. 归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
2. 时间复杂度:O(N*logN)
3. 空间复杂度:O(N)
4. 稳定性:稳定
归并的非递归:
注意这里只要begin1是不越界的,另外三个都可能越界,所以要单独用if函数处理越界的情况。
并且这里判断了这三个越界的情况还有可能会出现tmp越界的情况
实现代码一:
实现代码二:
2.5 非比较排序
思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。 操作步骤:
1. 统计相同元素出现次数
2. 根据统计的结果将序列回收到原来的序列中
这里要注意一个问题:如果出现了既有正数又有负数的情况下:就不适合计数排序。
如果全是负数的情况下在排序;那么我们将int强制类型转换成unsigned int,在内存中也就默认成为了正数,最后放回的时候再转换成有符号数即可.
3.排序算法复杂度及稳定性分析