![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘算法
文章平均质量分 74
iteye_4836
这个作者很懒,什么都没留下…
展开
-
Bloom Filter概念和原理
Bloom Filter概念和原理 焦萌 2007年1月27日 Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter...原创 2013-05-02 15:59:12 · 86 阅读 · 0 评论 -
CAP理论
1.CAP概述 CAP理论是由EricBrewer教授提出的,在设计和部署分布式应用的时候,存在三个核心的系统需求,这个三个需求之间存在一定的特殊关系。三个需求如下: C: Consistency 一致性 A: Availability 可用性 P:Partition Tolerance分区容错性 CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求...原创 2013-05-15 19:10:15 · 1233 阅读 · 0 评论 -
一致性哈希
一致性哈希(Consistent Hashing) 分类: 分布式算法 2010-10-18 16:44 2479人阅读 评论(2) 收藏 举报 hashmapservermemcachedintegerscheme负载均衡 直到现在为止,一致性哈希也没有一个非常明确的定义,多数文献还是从其应用场景之上对一致性哈希进行描述。“哈希”想必大家都已经了解,问题是何为“一致性”? 一...原创 2013-04-16 10:26:49 · 81 阅读 · 0 评论 -
蓄水池抽样
Reservoir Sampling 蓄水池抽样 海量数据不知道总数只能遍历一次随机抽样问题 2011年06月24日 星期五 下午 01:10 问题起源于编程珠玑Column 12中的题目10,其描述如下: How could you select one of n objects at random, where you see the objects sequentially bu...原创 2013-04-16 10:30:44 · 69 阅读 · 0 评论