海量数据
文章平均质量分 76
lsc740088022
这个作者很懒,什么都没留下…
展开
-
一道面试题,内存受限的情况,如何在海量的数据中找到重复最多的
昨天,去腾讯面试,被一道原创 2014-04-25 13:58:23 · 1042 阅读 · 0 评论 -
海量数据处理面试题集锦
本文由http://blog.csdn.net/v_july_v/article/details/6685962chu转载转载 2014-05-19 20:57:49 · 329 阅读 · 0 评论 -
BloomFilter–大规模数据处理利器
Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。一. 实例 为了说明Bloom Filter存在的重要意义,举一个实例: 假设要你写一个网络爬虫程序(web crawler)。由于网络间的链接错综复杂,爬虫在网络间爬行很可能会形成“环”。为了避免转载 2014-05-20 21:58:42 · 374 阅读 · 0 评论