算法题 - 大数据top-k
大数据问题、top-k问题
小猪快点跑
这个作者很懒,什么都没留下…
展开
-
top-k / top-kth
1、减治-快排 二分,平均每次只快排一半,n + n/2 + n/4 + ... ~=2n #include <iostream> #include <vector> #include <algorithm> #include <numeric> #include <climits> using namespace...原创 2019-09-02 13:23:55 · 202 阅读 · 0 评论 -
大数据问题
1、top-k、top-kth (1)减治快排,2n。 (2)小顶堆,nlogk。 (3)遍历k次,kn 2、找出10w个长度为20的字符串中重复次数最多的字符串 (1)hash_map 内存:(20+4)*10w = 800wB= 8MB,在堆上创建。 时间:存n,查n 3、1G内存,1T数据排序。 (1)分块+快排+归并 ...原创 2019-09-03 18:10:22 · 160 阅读 · 0 评论