题目:有一个包含100亿个URL的文件,假设每个URL占用64B,请找出其中所有重复的URL。
补充问题:某搜索公司一天的用户搜索词汇是海量的(百亿数据量),请设计一种求出每天热门 Top100 词汇的可行办法。
《Coding Interview Guide》P337:找到100亿个URL中重复的URL及搜索词汇的Top K问题
最新推荐文章于 2022-11-28 09:11:52 发布
题目:有一个包含100亿个URL的文件,假设每个URL占用64B,请找出其中所有重复的URL。
补充问题:某搜索公司一天的用户搜索词汇是海量的(百亿数据量),请设计一种求出每天热门 Top100 词汇的可行办法。