腾讯三面:40 亿个 QQ 号码如何去重?

在腾讯面试中,面对40亿个QQ号码的去重问题,文章介绍了四种方法:排序、使用HashMap、文件切割和Bitmap。排序和HashMap因时间复杂度和内存消耗被否决。文件切割虽降低内存需求,但效率不高。最后,Bitmap数据结构成为解决方案,它既能节省空间,又能高效完成去重任务。
摘要由CSDN通过智能技术生成

在原题中,实际有40亿个QQ号码,为了方便起见,在叙述时,仅以4个QQ为例来说明。

方法一:排序

很自然地,最简单的方式是对所有的QQ号码进行排序,重复的QQ号码必然相邻,保留第一个,去掉后面重复的就行。

原始的QQ号为:123,456,123,789

排序后的QQ号为:123,123,456,789

去重就简单了:123,456,789

可是,面试官要问你,去重一定要排序吗?显然,排序的时间复杂度太高了,无法通过腾讯面试。

方法二:hashmap

既然直接排序的时间复杂度太高,那就用hashmap吧,具体思路是把QQ号码记录到hashmap中:

mapFlag[123] = true mapFlag[567] = true mapFlag[123] = true mapFlag[890] = true

由于hashmap的去重性质,可知实际自动变成了:

mapFlag[123] = true mapFlag[567] = true mapFlag[890] = true

很显然,只有123,567,890存在,所以这也就是去重后的结果。

可是,面试官又要问你了:实际要存40亿QQ号码,1G的内存够分配这么多空间吗?显然不行,无法通过腾讯面试。

方法三:文件切割

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值