【原创】TOP k算法的简单实现

最新推荐文章于 2024-10-07 17:14:06 发布

our2848884

最新推荐文章于 2024-10-07 17:14:06 发布

阅读量1k

点赞数 1

分类专栏：算法设计

本文链接：https://blog.csdn.net/our2848884/article/details/70211787

版权

算法设计专栏收录该内容

8 篇文章 0 订阅

订阅专栏

顾名思义，TOP k就是从海量的数据中选取最大的k个元素或记录。基本思想就是维护一个具有k个元素的小顶堆。每当有新的元素加入时，判断它是否大于堆顶元素，如果大于，用该元素代替堆顶元素，并重新维护小顶堆，直到所有元素被处理完毕。时间复杂度为O(N*logk)，基本达到线性复杂度。部分代码如下：

//打印数组元素 
void print(int data[], int length) 
{ 
    for(int i = 1; i <= length; ++i) 
        cout << data[i] << " "; 
    cout << endl; 
} 
 
//维护小顶堆 
void modifySmallHeap(int data[], int location, int length) 
{ 
    int lchild = 2 * location; 
    int rchild = 2 * location + 1; 
    int smallest; 
    if(lchild <= length && data[lchild] < data[location])smallest = lchild; 
    else smallest = location; 
    if(rchild <= length && data[rchild] < data[smallest])smallest = rchild; 
 
    if(smallest != location) 
    { 
        swap(data[location], data[smallest]); 
        modifySmallHeap(data, smallest, length); 
    } 
} 
 
//建立小顶堆 
void buildSmallHeap(int data[], int length) 
{ 
    for (int i = length / 2; i > 0; --i) 
    { 
        modifySmallHeap(data, i, length); 
    } 
} 
 
//top k算法的简单实现 
void HeapSortK(int data[], int length, int topk) 
{ 
    buildSmallHeap(data, topk); 
    for (int i = topk + 1; i <= length; ++i) 
    { 
        if(data[i] <= data[1])continue; 
        else 
        { 
            swap(data[1], data[i]); 
            modifySmallHeap(data, 1, topk); 
        } 
    } 
}