- 博客(1)
- 收藏
- 关注
原创 面试海量数据处理题总结
参考:https://blog.csdn.net/v_july_v/article/details/6279498/目录top k 问题1、海量日志数据,提取出某日访问百度次数最多的那个IP。2.统计最热门的10个查询串3.有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。4.有10个文件,每个文件1G,每个...
2019-04-15 20:13:29 12017 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人