大众点评2015笔试题(答案)

1、有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。

答案:1)遍历10个文件的每个query,取t = hash(query)%10,将这个query存入第t个文件。这一步结果将相同query保存至同一个文件中,并且每个文件的大小约为1g

2)分别对每个文件,找出每个query的个数,使用hashmap(query,query_count),遍历文件query,查找map,query_count自增1

3)对每个文件,每个query进行排序,可以用快排或者堆排序

4)利用归并排序思想,对10个文件归并,就是取10个文件的堆顶最大,比较,然后输出最大的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值