像计算机这门学科,光看书是远远不够的,还要多动手,去谈谈究竟,才会深入理解。就比如说TCP/IP协议栈,光看《TCP/IP协议详解》是远远不够的,还要学会写网络程序,在写的过程中,你可能会遇到各种各样的问题,这样就会促使回去再去仔细研究书本的内容,加深理解同时使得印象深刻。
Hadoop家族现在包含很多组件,其中就包括Hbase
1. Hbase产生的背景
Hbase主要起源于Google的三大论文之一的BigTable,主要是Google为解决海量数据存储而设计,因为Google每天要爬取全球数以千计的页面,因此存储他们的URL就需要海量存储数据库,在这种背景下,也就诞生了BigTable,Hbase是BigTable的开源实现,值得一提的是,Hbase并不是传统的RDBMS,而是NoSQL,或者更准确的称之为列数据库。
2. Hbase的应用场景
很显然,Hbase一般用于海量数据的存储,海量大概是一个怎样的量级?大约是billion(十亿)*million(百万),而一般的关系型数据库存储量大概在500万行*30列,超过这样的规模,关系型数据库就会难以处理,另外Hbase还支持动态扩容。
3. Hbase入门
入门Hbase应该通过哪种方式?无非就是玩玩呗
单机版的伪分布式Hbase特别好安装,可以下载下来玩一下。可以按照如下步骤简单的配置单机版本的Hbase
(1)下载Hbase
(2)解压