排序算法概述
- 排序目的:便于查找。
- 排序算法好坏的衡量指标:时间效率(时间复杂度、比较次数),空间效率(空间复杂度、占内存辅助空间大小),稳定性(关键字值相等的记录A和B在排序后先后次序不变则稳定)
- 内部排序概念:待排序记录都在内存中。
外部排序概念:待排序记录一部分在内存,一部分在外存(硬盘等)。
排序分类
- 按排序规则不同分为:
插入排序
交换排序
选择排序
归并排序
基数排序 - 按时间复杂度不同分为:
简单排序 O(n2)
先进排序 O(nlog2n)
基数排序 O(d*n) ——其中d=关键字的位数
堆排序
因为最近在刷leetcode的时候多次遇到使用堆排序解决的题目,所以特别写在笔记里,一劳永逸。
概念
堆排序是由1991年的计算机先驱奖获得者、斯坦福大学计算机科学系教授罗伯特.弗洛伊德(Robert W.Floyd)和威廉姆斯(J.Williams)在1964年共同发明了的一种排序算法( Heap Sort );
- 概念:大顶堆和小顶堆(也叫大根堆和小根堆)。
- 定义:堆的定义:设有n个元素的序列 k1,k2,…,kn,当且仅当满足下述关系之一时,称之为堆。
大顶堆:
当用一位数组存储这个序列,就是在一个完全二叉树中,所有父节点比它的子节点都要大。根节点的值最大。
小顶堆:(略)
方法
描述:设有n个元素,将其按关键码排序。首先将这n个元素按关键码建成堆,将堆顶元素输出,得到n个元素中关键码最小(或最大)的元素。然后,再对剩下的n-1个元素建成堆,输出堆顶元素,得到n个元素中关键码次小(或次大)的元素。如此反复,便得到一个按关键码有序的序列。称这个过程为堆排序。
概括:
1.先对元素序列整理成堆。
2.将首尾元素互换位置,即交换完全二叉树中根节点与最后一个叶子节点之间的位置。
3.将剩下的n-1个元素视为一个完全二叉树并整理成堆。以此循环,直到二叉树只剩一个根节点。
需要解决的问题有两个:
1.将n个元素的序列整理成堆。
2.调整后n-1个元素的序列整理成堆。
(思考1:为什么要建堆?要排序的话,每次把最大或者最小值找到并拎出来不就好了吗?为什么要把整体结构都弄成堆的格式?)
问题1 初始建堆方法(以建大根堆为例):
- 因为叶子节点没有子节点,所以不存在它小于子节点的情况,不需要调整。所以要从最后一个非叶子节点开始从后往前逐个调整非叶子节点。(思考2:为什么是从后往前而不是从前往后?)
- 根据完全二叉树的性质,若有n个节点,则最后一个非叶子节点的序号为⌊n/2⌋。(因为默认序列元素从1开始,所以序号为
⌊n/2⌋。通常在程序中,顺序表序号从0开始,此时最后一个一个非叶子节点的序号为⌊(n-1)/2⌋。)所以从以⌊n/2⌋为父节点的子树开始将整棵树整理成堆,即整理完以序号为⌊n/2⌋的元素为根的子树后,再整理以序号为⌊n/2⌋-1的元素为根的子树,一直整理到根节点。 - 在对以每个元素为根节点的子树进行整理时,如果出现max(左子,右子)大于目前子树的根节点,则需要将max(左子,右子)的值与根