http://bbs.csdn.net/topics/270007317
例如,我要从1亿条记录中找出10个关键字最大的记录,这个时候只需要先用1-10这10个记录建立一个大小的10的堆,然后调整她为小顶堆(大顶堆),然后依次用堆中最大或者最小的关键词对第11-1亿的每一个记录的关键字进行比较,若是要求最大的10个记录,则用小顶堆中最小的元素和新来的值比较,若比他小则继续下一个,若比他大则替换掉小顶堆中最小的元素,然后再调整小顶堆,(1亿-10 )个记录比较完后,留下的小顶堆中元素的值就是最大的10个值,而且时间主要花在了替换了堆顶的元素后的调整堆结构的操作上面,找最小的10个值亦然。
本文介绍了一种高效检索大数据集中最大或最小关键字的方法:利用堆数据结构。具体步骤包括初始化一个固定大小的堆,通过不断比较和替换元素来维护堆内元素的范围,最终得到所需的指定数量的最大或最小关键字。

被折叠的 条评论
为什么被折叠?



