注:面试过程中整理的学习资料,如有侵权联系我即刻删除。 目录 上亿万数量级的海量查询,比如十亿订单中,找出前一百个销量最好的产品 对于一个海量的文件中存储着不同的URL,用最小的时间复杂度去除重复的URL 给定a、b两个文件,各存放50亿个ur,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。 对于海量数据,用什么数据结构存储用户搜索的高频关键词比较合适?比如,当用户输入“黄”字,输入框要自动显 示“黄晓明”,“黄蓉”,“黄山”,“黄鹤楼”等提示,但是能存储的量很有限,所以需要选择恰当的数据结构。 哈夫曼树 用#define声明一个常数,表明1年中有多少秒(忽略闰年问题)? c++关键字voatile C++中下列数据类型所占的字节数以及数值表示范围