1.哈希分流到多台机器
2.哈希表统计每个机器中的每个小文件
3.最小堆(想一想为什么是最小堆?)
找到100亿个url中重复的url以及搜索词汇的topk问题
最新推荐文章于 2024-04-18 17:37:57 发布
1.哈希分流到多台机器
2.哈希表统计每个机器中的每个小文件
3.最小堆(想一想为什么是最小堆?)