堆排序 Heap Sort
堆排序是一种选择排序的改进算法,其实也就是个比纯粹的选择排序算法更加快速。
为什么一谈堆排序我们就会先谈谈选择排序,如果看过我写过相关选择排序会发现,选择排序在找到一个最小的元素的时间复杂度是0(n^2) 因此我们想改进针对数组的排序算法需要解决当前的瓶颈。
若将和此序列对应的一维数组(即以一维数组作此序列的存储结构)看成是一个完全二叉树,则堆的含义表明,完全二叉树中所有非终端结点的值均不大于(或不小于)其左、右孩子结点的值。
由此,若序列{k1,k2,…,kn}是堆,则堆顶元素(或完全二叉树的根)必为序列中n个元素的最小值(或最大值)。
例如,下列两个序列为堆,对应的完全二叉树如图:
若在输出堆顶的最小值之后,使得剩余n-1个元素的序列重又建成一个堆,则得到n个元素的次小值。如此反复执行,便能得到一个有序序列,这个过程称之为堆排序。
堆的存储
一般用数组来表示堆,若根结点存在序号0处, i结点的父结点下标就为i/2。i结点的左右子结点下标分别为2*i+1和2*i+2。
(注:如果根结点是从1开始,则左右孩子结点分别是2i和2i+1。)
如第0个结点左右子结点下标分别为1和2。
如最大化堆如下:
左图为其存储结构我们用数组形式存储,右图为其逻辑结构就是我们脑袋中想的关系图。
堆排序的实现
实现堆排序需要解决两个问题:
1.如何由一个无序序列建成一个堆?
2.如何在输出堆顶元素之后,调整剩余元素成为一个新的堆?
先考虑第二个问题,一般在输出堆顶元素之后,视为将这个元素排除,然后用表中最后一个元素填补它的位置,自上向下进行调整:首先将堆顶元素和它的左右子树的根结点进行比较,把最小的元素交换到堆顶;然后顺着被破坏的路径一路调整下去,直至叶子结点,就得到新的堆。
我们称这个自堆顶至叶子的调整过程为“筛选”。
从无序序列建立堆的过程就是一个反复“筛选”的过程。
构造初始堆
初始化堆的时候是对所有的非叶子结点进行筛选。
最后一个非终端元素的下标是[n/2]向下取整,所以筛选只需要从第[n/2]向下取整个元素开始,从后往前进行调整。
比如,给定一个数组,首先根据该数组元素构造一个完全二叉树。
然后从最后一个非叶子结点开始,每次都是从父结点、左孩子、右孩子中进行比较交换,交换可能会引起孩子结点不满足堆的性质,所以每次交换之后需要重新对被交换的孩子结点进行调整。
进行堆排序
有了初始堆之后就可以进行排序了。
堆排序是一种选择排序。建立的初始堆为初始的无序区。
排序开始,首先输出堆顶元素(因为它是最值),将堆顶元素和最后一个元素交换,这样,第n个位置(即最后一个位置)作为有序区,前n-1个位置仍是无序区,对无序区进行调整,得到堆之后,再交换堆顶和最后一个元素,这样有序区长度变为2。。。
不断进行此操作,将剩下的元素重新调整为堆,然后输出堆顶元素到有序区。每次交换都导致无序区-1,有序区+1。不断重复此过程直到有序区长度增长为n-1,排序完成。
堆排序实例
首先,建立初始的堆结构如图:
然后,交换堆顶的元素和最后一个元素,此时最后一个位置作为有序区(有序区显示为黄色),然后进行其他无序区的堆调整,重新得到大顶堆后,交换堆顶和倒数第二个元素的位置……
重复此过程:
最后,有序区扩展完成即排序完成:
由排序过程可见,若想得到升序,则建立大顶堆,若想得到降序,则建立小顶堆。
代码
假设排列的元素为整型,且元素的关键字为其本身。
因为要进行升序排列,所以用大顶堆。
根结点从0开始,所以i结点的左右孩子结点的下标为2i+1和2i+2。
Heap Sort
堆排序分析
堆排序方法对记录数较少的文件并不值得提倡,但对n较大的文件还是很有效的。因为其运行时间主要耗费在建初始堆和调整建新堆时进行的反复“筛选”上。
算法实现代码
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
namespace 堆排序___顺序存储
{
class Program
{
static void Main(string[] args)
{
int[] data = { 50, 10, 90, 30, 70, 40, 80, 60, 20 };
HeapSort(data);
foreach (int i in data)
{
Console.Write(i + " ");
}
Console.WriteLine();
Console.ReadKey();
}
public static void HeapSort(int[] data)
{
for (int i = data.Length / 2; i >= 1; i--)//遍历这个数的所有非叶结点 ,挨个把所有的子树,变成子大顶堆
{
HeapAjust(i, data, data.Length);
//经过上面的for循环,是把二叉树变成了大顶堆
}
for (int i = data.Length; i > 1; i--)
{//把 编号1 和编号i位置进行交换
// 1 到 (i-1)构造成大顶堆
int temp1 = data[0];
data[0] = data[i - 1];
data[i - 1] = temp1;
HeapAjust(1, data, i - 1);
}
}
private static void HeapAjust(int numberToAjust, int[] data, int maxNumber)
{
int maxNodeNumber = numberToAjust;//最大结点的编号
int tempI = numberToAjust;
while (true)
{
//把i结点的子树变成大顶堆
int leftChildNumber = tempI * 2;
int rightChildNumber = leftChildNumber + 1;
if (leftChildNumber <= maxNumber && data[leftChildNumber - 1] > data[maxNodeNumber - 1])
{
maxNodeNumber = leftChildNumber;
}
if (rightChildNumber <= maxNumber && data[rightChildNumber - 1] > data[maxNodeNumber - 1])
{
maxNodeNumber = rightChildNumber;
}
if (maxNodeNumber != tempI)//发现了一个比i更大的子结点,交换i和maxnodenumber里面的数据
{
int temp = data[tempI - 1];
data[tempI - 1] = data[maxNodeNumber - 1];
data[maxNodeNumber - 1] = temp;
tempI = maxNodeNumber;
}
else
{
break;
}
}
}
}
堆排序算法的时间复杂度分析: 首先我们有一个待排序数组,比如array[5] = {2,1,5,4,3} 5个数字
我们需要将这组数据进行从小到到排序,本来我们可以用选择排序算法来达到有序,但是选择排序算法在得到一个最小值的时候需要的时间复杂度是0(n^2) ,因此我们用堆排序来减少这个得到最小值的时间消耗,我们第一次需要调整堆,这个时候我们需要从树的下面开始建堆从底向上建立初始堆