- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 关于海量数据TopK问题的一个具体实现(java)
例题:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。
2014-08-26 13:08:29 1548 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人