[转]【啊哈!算法】算法11:堆——神奇的优先队列(上)--作者:ahalei

转载 2016年08月29日 17:19:42

堆是什么?是一种特殊的完全二叉树,就像下面这棵树一样。

        有没有发现这棵二叉树有一个特点,就是所有父结点都比子结点要小(注意:圆圈里面的数是值,圆圈上面的数是这个结点的编号,此规定仅适用于本节)。符合这样特点的完全二叉树我们称为最小堆。反之,如果所有父结点都比子结点要大,这样的完全二叉树称为最大堆。那这一特性究竟有什么用呢?

        假如有14个数分别是995367221746122192528192。请找出这14个数中最小的数,请问怎么办呢?最简单的方法就是将这14个数从头到尾依次扫一遍,用一个循环就可以解决。这种方法的时间复杂度是O(14)也就是O(N)

1
2
3
4
for(i=1;i<=14;i++)
{
    if(a[ i]<min)    min=a[ i];
}

        现在我们需要删除其中最小的数,并增加一个新数23,再次求这14个数中最小的一个数。请问该怎么办呢?只能重新扫描所有的数,才能找到新的最小的数,这个时间复杂度也是O(N)。假如现在有14次这样的操作(删除最小的数后并添加一个新数)。那么整个时间复杂度就是O(142)O(N2)。那有没有更好的方法呢?堆这个特殊的结构恰好能够很好地解决这个问题。

        首先我们先把这个14个数按照最小堆的要求(就是所有父结点都比子结点要小)放入一棵完全二叉树,就像下面这棵树一样。

        很显然最小的数就在堆顶,假设存储这个堆的数组叫做h的话,最小数就是h[ 1]。接下来,我们将堆顶的数删除,并将新增加的数23放到堆顶。显然加了新数后已经不符合最小堆的特性,我们需要将新增加的数调整到合适的位置。那如何调整呢?

        向下调整!我们需要将这个数与它的两个儿子25比较,并选择较小一个与它交换,交换之后如下。

        我们发现此时还是不符合最小堆的特性,因此还需要继续向下调整。于是继续将23与它的两个儿子127比较,并选择较小一个交换,交换之后如下。

        到此,还是不符合最小堆的特性,仍需要继续向下调整直到符合最小堆的特性为止。

        我们发现现在已经符合最小堆的特性了。综上所述,当新增加一个数被放置到堆顶时,如果此时不符合最小堆的特性,则将需要将这个数向下调整,直到找到合适的位置为止,使其重新符合最小堆的特性。

 

 

        向下调整的代码如下。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
void siftdown(int i) //传入一个需要向下调整的结点编号i,这里传入1,即从堆的顶点开始向下调整 
{
    int t,flag=0;//flag用来标记是否需要继续向下调整 
    //当i结点有儿子的时候(其实是至少有左儿子的情况下)并且有需要继续调整的时候循环窒执行
    while( i*2<=n && flag==0 )
    {        
        //首先判断他和他左儿子的关系,并用t记录值较小的结点编号 
        if( h[ i] > h[ i*2] )
            t=i*2;
        else
            t=i; 
        //如果他有右儿子的情况下,再对右儿子进行讨论 
        if(i*2+1 <= n)
        {
            //如果右儿子的值更小,更新较小的结点编号  
            if(h[ t] > h[ i*2+1])
                t=i*2+1;
        }
        //如果发现最小的结点编号不是自己,说明子结点中有比父结点更小的  
        if(t!=i)
        {
            swap(t,i);//交换它们,注意swap函数需要自己来写
            i=t;//更新i为刚才与它交换的儿子结点的编号,便于接下来继续向下调整 
        }
        else
            flag=1;//则否说明当前的父结点已经比两个子结点都要小了,不需要在进行调整了 
    }
}


 

        我们刚才在对23进行调整的时候,竟然只进行了3次比较,就重新恢复了最小堆的特性。现在最小的数依然在堆顶为2。之前那种从头到尾扫描的方法需要14次比较,现在只需要3次就够了。现在每次删除最小的数并新增一个数,并求当前最小数的时间复杂度是O(3),这恰好是O(log214)O(log2N)简写为O(logN)。假如现在有1亿个数(即N=1亿),进行1亿次删除最小数并新增一个数的操作,使用原来扫描的方法计算机需要运行大约1亿的平方次,而现在只需要1亿*log1亿次,即27亿次。假设计算机每秒钟可以运行10亿次,那原来则需要一千万秒大约115天!而现在只要2.7秒。是不是很神奇,再次感受到算法的伟大了吧。

        说到这里,如果只是想新增一个值,而不是删除最小值又该如何操作呢?即如何在原有的堆上直接插入一个新元素呢?只需要直接将新元素插入到末尾,再根据情况判断新元素是否需要上移,直到满足堆的特性为止。如果堆的大小为N(即有N个元素),那么插入一个新元素所需要的时间也是O(logN)。例如我们现在要新增一个数3

 

 

        先将3与它的父结点25比较,发现比父结点小,为了维护最小堆的特性,需要与父结点的值进行交换。交换之后发现还是要比它此时的父结点5小,因此需要再次与父结点交换。至此又重新满足了最小堆的特性。向上调整完毕后如下。

        向上调整的代码如下。

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
void siftup(int i) //传入一个需要向上调整的结点编号i
{
    int flag=0; //用来标记是否需要继续向上调整
    if(i==1)  return//如果是堆顶,就返回,不需要调整了    
    //不在堆顶 并且 当前结点i的值比父结点小的时候继续向上调整 
    while(i!=1 && flag==0)
    {
        //判断是否比父结点的小 
        if(h[ i]<h[ i/2])
            swap(i,i/2);//交换他和他爸爸的位置 
        else
            flag=1;//表示已经不需要调整了,当前结点的值比父结点的值要大 
        i=i/2; //这句话很重要,更新编号i为它父结点的编号,从而便于下一次继续向上调整 
    }
}


        说了半天,我们忽略一个很重要的问题!就是如何建立这个堆。我们周一接着说。

        BTW,《啊哈!算法》系列,坐在马桶上都能读懂的算法入门书,已经整理出版,下周一将是最后一次在线更新啦(把堆说完)。各位喜欢《啊哈!算法》的朋友要去买一本搜藏哦 这年头写个东西不容易,多谢大家支持啦,当当网购买链接  http://product.dangdang.com/23490849.html

 

        买了的朋友记得来啥单,还可以得到《啊哈!算法》的T恤哦~~~ http://www.ahalei.com/thread-4969-1-1.html

相关文章推荐

轻松学算法11:堆——神奇的优先队列

堆是什么?是一种特殊的完全二叉树,就像下面这棵树一样。         有没有发现这棵二叉树有一个特点,就是所有父结点都比子结点要小(注意:圆圈里面的数是值,圆圈上面的数是这个结点的编号...
  • fngy123
  • fngy123
  • 2014年10月06日 21:37
  • 442

【坐在马桶上看算法】算法12:堆——神奇的优先队列(下)

接着上一Pa说。就是如何建立这个堆呢。可以从空的堆开始,然后依次往堆中插入每一个元素,直到所有数都被插入(转移到堆中为止)。因为插入第i个元素的所用的时间是O(log i),所以插入所有元素的整体...

【坐在马桶上看算法】算法12:堆——神奇的优先队列(下)

这位朋友写的特别好,忍不住转发 :-) http://ahalei.blog.51cto.com/4767671/1427156 接着上一Pa说。就是如何建立这个堆呢。可以从空的堆开始,然后...
  • Orbita
  • Orbita
  • 2017年07月17日 15:28
  • 99

[转]【坐在马桶上看算法】算法3:最常用的排序——快速排序--作者:ahalei

上一节的冒泡排序可以说是我们学习第一个真正的排序算法,并且解决了桶排序浪费空间的问题,但在算法的执行效率上却牺牲了很多,它的时间复杂度达到了O(N2)。假如我们的计算机每秒钟可以运行10亿次,那么对1...

《常见算法和数据结构》优先队列(2)——二叉堆

1.二叉堆1.1二叉堆的定义堆是一个完全二叉树结构(除了最底下一层,其他层全是完全平衡的),如果每个结点都大于它的两个孩子,那么这个堆是有序的。 二叉堆是一组能够用堆有序的完全二叉树排序的元素,...

图论——Dijkstra+prim算法涉及到的优先队列(二叉堆)

【0】README0.1)为什么有这篇文章?因为 Dijkstra算法的优先队列实现 涉及到了一种新的数据结构,即优先队列(二叉堆)的操作需要更改以适应这种新的数据结构,我们暂且吧它定义为Distan...

优先队列算法实现(Java)

  • 2009年06月01日 12:49
  • 4KB
  • 下载

堆——神奇的优先队列(下)

接着上一Pa说。就是如何建立这个堆呢。可以从空的堆开始,然后依次往堆中插入每一个元素,直到所有数都被插入(转移到堆中为止)。因为插入第i个元素的所用的时间是O(log i),所以插入所有元素的整体...
  • wsxsd94
  • wsxsd94
  • 2014年08月17日 16:55
  • 325

数据结构与算法——优先队列类的C++实现(二叉堆)

优先队列类的C++实现(二叉堆) ;二叉堆与二叉查找树类似,二叉树有两个性质:结构性质和堆序性质。 那些运行时间短的进程需要比较高的优先权,同样,那些比较重要的进程也需要比较高的优先权。这种特殊的应用...

数据结构与算法(23)——优先队列和堆

优先队列(Priority Queue)是一种数据结构,它支持插入(Insert)操作和删除最小值(DeleteMin)或删除最大值(DeleteMax)并返回删除元素操作。 优先队列的这些操作等价于...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:[转]【啊哈!算法】算法11:堆——神奇的优先队列(上)--作者:ahalei
举报原因:
原因补充:

(最多只允许输入30个字)