如何使用大顶堆和小顶堆找topN、如何从大量数据中找出高频词?

如何使用大顶堆和小顶堆找topN

  • 我们如何从一个链表或者数组中,找到第k大的数,或者前k大的数。使用小顶堆。(输出是从小到大排列的前K大的数
  • 我们如何从一个链表或者数组中,找到第k小的数,或者前k小的数(输出的堆是堆顶最大,其他不是序列顺序),使用大顶堆。
    小顶堆找TopN元素:

一、使用java.util.PriorityQueue优先级队列,默认是从小到大排序,初始指定最大容量为N

二、当size()大小<N的时候直接加到队列会自动排序,当size()>=N的时候将新val与堆顶最小的比较替换(其中queue.poll是弹出数组第一个元素,也即是堆顶的最小元素元素)

可运行完整代码:

package com.排序;
import java.util.PriorityQueue;

public class 小顶堆找最大TopN {
    static int N = 4;
    static PriorityQueue<Integer> queue;   // 优先级队列默认小顶堆
    public static void main(String[] args) {
        queue = new PriorityQueue<Integer>(N);
        int[] arr = {1, 3, 5, 2, 6};
        for (int num : arr) {   // 把数组元素放到堆中
            小顶堆找TopN.add(num);
        }
    }

    private static void add(int val) {   // 选出前N大的数
        if (queue.size() < N) {   // 先比较,再添加(size=3,添加元素2,之后此if走完size就会变为4)
            queue.offer(val);
        } else if (queue.size() >= N && queue.peek() < val) {   // 小顶堆堆顶存放堆中最小的数,如果有val比堆顶元素大,就弹出最小(堆顶) 并 添加新元素
            queue.poll();
            queue.offer(val);
        }
        System.out.println("数组中第" + N + "大的数是:" + queue.peek());
        System.out.println("从小到大前N个数的堆为:" + queue);
    }
}

JDK1.8中的优先级队列[5, 4, 3, 2, 1]的的peek值是5

  • 优先级队列如果是从小到大【默认】加入元素进队列打印为从小到大顺序
  • 如果是自定义比较器从大到小,则只能保证元素的peek为最大的,内部元素不一定是从大到小排列

在这里插入图片描述
参考:Java 中队列的使用

如何从大量数据中找出高频词?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值