堆是一个完全二叉树,除了最后一层节点,上面所有节点都是非空的,最后一层节点是从左到右依此排布。如下图所示。
小根堆性质:每一个点是小于等于左右儿子的,根节点是集合中的最小值。
堆的存储:
下标从 1 开始,x 的左儿子是 2*x,右儿子是 2*x+1 ,通过一维数组 a[N] 存储,如图所示;
两个操作:down操作(把一个节点往下移)与 up操作(把一个节点往上移)
up操作:
如以下例子:
将上图树中的 a[9]=4 改成 a[9]=2,若要满足堆的性质 2 就要向上走,up操作就是当前节点与父结点比较大小,若当前节点比父节点小则交换位置,直到满足小根堆的性质。
实现代码:
void up(int u)//u为下标
{
while (u / 2 && h[u] < h[u / 2])
{
swap(u, u / 2);
u >>= 1;
}
}
down操作:
如以下例子:
将原来树中的a[2]=3 改成 a[2]=7,堆要满足其性质 7 就需要向下移,down操作即为,父节点与其左右儿子比较,与最小的儿子交换,直到满足堆的性质。
实现代码:
void down(int u)
{
int t = u;
if (u * 2 <= cnt && h[u * 2] < h[t])
{
t = u * 2;
}
if (u * 2 + 1 <= cnt && h[u * 2 + 1] < h[t])
{
t = u * 2 + 1;
}
if (u != t)
{
swap(u, t);
down(t);
}
}
//以上过程中的if不能用else if代替,必须都执行一遍
手写一个堆:
设 heap[N] 为存储堆的数组,size 为当前堆中已用到的下标(以上堆中的size=9)。
1.插入一个数
heap[++size]=x;
up(size);
2.求集合中的最小值
heap[1];
3.删除最小值
heap[1]=heap[size];
size--;
down(1);
以上代码中的三步分别对应以下变化
4.删除任意元素
heap[k]=heap[size];
size--;
down(k);
up(k);
5.修改任意元素
heap[k]=x;
down(k);
up(k);
因为不知道任意元素的大小,所以删除任意元素与修改任意元素需要down和up都做一遍。
例题:
堆排序
题目描述:
输入一个长度为 n 的整数数列,从小到大输出前 m 小的数。
输入格式:
第一行包含整数 n 和 m。
第二行包含 n 个整数,表示整数数列。
输出格式:
共一行,包含 m 个整数,表示整数数列中前 m 小的数。
数据范围:
1≤m≤n≤100000
1≤数列中元素≤1000000000
输入样例:
5 3
4 5 1 3 2
输出样例:
1 2 3
解题代码:
# include <iostream>
using namespace std;
const int N = 100010;
int n, m, heap[N];
void down(int x)
{
int t = x;
if (x * 2 <= n && heap[t] > heap[2 * x])t = x * 2;//父节点与左儿子比较并交换
if (x * 2 + 1 <= n && heap[t] > heap[2 * x + 1])t = 2 * x + 1;//父节点与右儿子比较并交换
if(t!=x)//若无判断条件,当t=x时递归可能一直进行下去
{
swap(heap[t], heap[x]);
down(t);//递归,直到复合小根堆性质
}
}
int main()
{
scanf("%d %d", &n, &m);
for(int i=1;i<=n;i++)
{
scanf("%d", &heap[i]);
}
for(int i=n/2;i>=1;i--)
{
down(i);
}
while(m--)
{
printf("%d ",heap[1]);
heap[1] = heap[n--];
down(1);
}
return 0;
}
其中有一段为
for(int i=n/2;i>=1;i--)
{
down(i);
}
这一段代码的目的是将数组构建成小根堆。
问题:
1.为何从 i=n/2 开始 down?
由图可以看出 n/2是最后一个拥有孩子的内部节点,最后的一层叶节点不需要down,所以从n/2开始down。
2.为何不能从 根节点 开始 down?
由上图所示,数组中的数是随机插入的,本来 heap[4]=1 在数组中是最小的,应做根节点,但由根节点处开始down无法使1走到根节点,故出现了错误。
进阶题:
模拟堆
题目描述:
维护一个集合,初始时集合为空,支持如下几种操作:
I x
,插入一个数 x;PM
,输出当前集合中的最小值;DM
,删除当前集合中的最小值(数据保证此时的最小值唯一);D k
,删除第 k 个插入的数;C k x
,修改第 k 个插入的数,将其变为 x;
现在要进行 N 次操作,对于所有第 2 个操作,输出当前集合的最小值。
输入格式:
第一行包含整数 N。
接下来 N 行,每行包含一个操作指令,操作指令为 I x
,PM
,DM
,D k
或 C k x
中的一种。
输出格式:
对于每个输出指令 PM
,输出一个结果,表示当前集合中的最小值。每个结果占一行。
数据范围:
1≤N≤100000
−1000000000≤x≤1000000000
数据保证合法。
输入样例:
8
I -10
PM
I -10
D 1
C 2 8
I 6
PM
DM
输出样例:
-10
6
解题代码:
#include <iostream>
#include <algorithm>
#include <string.h>
using namespace std;
const int N = 100010;
int h[N], ph[N], hp[N], cnt;
void heap_swap(int a, int b)
{
swap(ph[hp[a]],ph[hp[b]]);
swap(hp[a], hp[b]);
swap(h[a], h[b]);
}
void down(int u)
{
int t = u;
if (u * 2 <= cnt && h[u * 2] < h[t]) t = u * 2;
if (u * 2 + 1 <= cnt && h[u * 2 + 1] < h[t]) t = u * 2 + 1;
if (u != t)
{
heap_swap(u, t);
down(t);
}
}
void up(int u)
{
while (u / 2 && h[u] < h[u / 2])
{
heap_swap(u, u / 2);
u >>= 1;
}
}
int main()
{
int n, m = 0;
scanf("%d", &n);
while (n -- )
{
char op[5];
int k, x;
scanf("%s", op);
if (!strcmp(op, "I"))
{
scanf("%d", &x);
cnt ++ ;
m ++ ;
ph[m] = cnt, hp[cnt] = m;
h[cnt] = x;
up(cnt);
}
else if (!strcmp(op, "PM")) printf("%d\n", h[1]);
else if (!strcmp(op, "DM"))
{
heap_swap(1, cnt);
cnt -- ;
down(1);
}
else if (!strcmp(op, "D"))
{
scanf("%d", &k);
k = ph[k];
heap_swap(k, cnt);
cnt -- ;
up(k);
down(k);
}
else
{
scanf("%d%d", &k, &x);
k = ph[k];
h[k] = x;
up(k);
down(k);
}
}
return 0;
}