![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
BigData
zzq_99999
这个作者很懒,什么都没留下…
展开
-
HBase基本知识
一、HBase基本知识 1.HBase简介 HBase 最开始是受 Google 的 BigTable 启发而开发的分布式、多版本、面向列的开源数据库。其主要特点是支持上亿行、百万列,支持强一致性、并且具有高扩展、高可用等特点。 既然 HBase 是一种分布式的数据库,那么其和传统的 RMDB 有什么区别的呢?我们先来看看HBase表核心概念,理解这些基本的核心概念对后面我理解 HBase ...原创 2018-10-27 14:58:10 · 202 阅读 · 0 评论 -
大数据和空间限制
以具体的题目为引入,分析具体的大数据在空间限制情景下的查找和排序 1.网页过滤系统:每个网页的URL最多占64B,包含一个包含100亿个黑名单网页,判断出现的网页是否在黑名单上 要求: 允许有万分之一以下的失误率 额外空间不要超过30G 解答: 首先想到的方法:将URL用哈希表保存下来,然后根据遍历哈希表进行查询,但是100亿*64B(),不满足要求2 由于系统容忍一定程度的失误率,但...原创 2018-11-13 20:48:38 · 364 阅读 · 0 评论