大数据算法
文章平均质量分 75
-柚子皮-
╰☆ゞ不染纤尘,不忘初心ゞ☆╮
展开
-
BitMap算法
http://blog.csdn.net/pipisorry/article/details/62443757BitMapBitMap从字面的意思,很多人认为是位图,其实准确的来说,翻译成基于位的映射。在所有具有性能优化的数据结构中,大家使用最多的就是hash表,是的,在具有定位查找上具有O(1)的常量时间,多么的简洁优美。但是数据量大了,内存就不够了。当然也可以使用类似外排序来解决问题的,由于要原创 2017-03-19 22:05:50 · 43234 阅读 · 7 评论 -
Count-Min Sketch 算法
http://blog.csdn.net/pipisorry/article/details/64126199统计频率算法问题:如果老板让你统计一个实时的数据流中元素出现的频率,并且准备随时回答某个元素出现的频率,不需要的精确的计数,那该怎么办?hashmap解决直觉告诉我们可能需要一个巨大的 HashMap 来统计各个元素的出现频率,但由于不同的元素的个数可能非常大,以至于是个天...原创 2017-03-20 15:16:36 · 28722 阅读 · 2 评论 -
Bloom Filter布隆过滤器
http://blog.csdn.net/pipisorry/article/details/64127666Bloom Filter简介 Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。布隆过滤器(英语:Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过原创 2017-03-20 20:33:49 · 6585 阅读 · 2 评论