布隆过滤器的面试应用

最新推荐文章于 2024-11-04 16:54:34 发布

nkliuliu

最新推荐文章于 2024-11-04 16:54:34 发布

阅读量76

点赞数

分类专栏：数据结构和算法文章标签：面试 Google HTML

数据结构和算法专栏收录该内容

9 篇文章 0 订阅

订阅专栏

如何从存放在A和B中的一亿条URL中找出A中有而B中没有的URL？

布隆过滤器应该以一种比较好的解决方案，而且只用比较一次，查找效率很高。从存储空间上来讲，如果用哈希表，假定网址的平均长度为一百个字符，那么1一亿个url大概需要20g存储空间。哈希表的存储效率一般只有 50%，所以实际存储空间大概需要40g。布隆过滤器只需要哈希表 1/8 到 1/4 的大小就能解决同样的问题。也就是需要大概10g以下的空间，也是比较理想的。当然也有麻烦的地方就是有可能不是100%准确。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。