科普
昨日西风紧
被深痛一击过后, 人生不过如此
展开
-
CAP理论
CAP理论由Eric Brewer在ACM PODC会议上的主题报告中提出,这个理论是NoSQL数据管理系统构建的基础,如下图所示: ▲CAP理论 其中字母“C”、“A”、“P”分别代表以下三个特征: ·强一致性(Consistency)。系统在执行过某项操作后仍然处于一致的状态。在分布式系统中,更新操作执行成功后所有的用户都应该读取到最新的值,这样的系统被转载 2014-05-07 16:11:38 · 659 阅读 · 0 评论 -
海量数据处理常用思路和方法
1.Bloom filter 适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集 基本原理及要点: 对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1,查找时如果发现所有hash函数对应位都是1说明存在,很明显这个过程并不保证查找的结果是100%正确的。同时也不支持删除一个已经插入的关键字,因为该关键字对应的位会牵动到其他的关键字。转载 2014-05-08 11:46:11 · 442 阅读 · 0 评论