HBase学习之路(一):HBase的基本概念与HBase完全分布式搭建

最新推荐文章于 2024-04-19 12:14:51 发布

萧邦主

最新推荐文章于 2024-04-19 12:14:51 发布

阅读量497

点赞数

分类专栏： Hadoop生态大数据生态文章标签：大数据 HBase完全分布式搭建 HBase简介

本文链接：https://blog.csdn.net/qq_41955099/article/details/89523367

版权

本文介绍了HBase的基本概念，包括它的诞生背景及与Hive的区别，并详细阐述了HBase完全分布式环境的搭建步骤，包括安装、配置、启动和测试，为深入学习HBase奠定了基础。

摘要由CSDN通过智能技术生成

HBase是一个分布式的、面向列的建立在Hadoop之上的开源非关系型数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的基于列的而不是基于行的数据库。

传统的RDBMS的处理大数据的瓶颈。传统的RDBMS在处理小规模数据有着绝对的优势：1.提供二维表格模型，对于结构化数据的组织非常适合，且提供大量的索引帮助用户快速定位和修改数据；2.提供完整的事务支持使得数据的读写的安全性得到了有力保障；3.使用SQL语言查询和修改数据，编程便捷。但是如果面对海量的数据，传统的RDBMS会显得力不从心，因为光是建立索引已经耗费大量的空间，在处理海量数据时RDBMS遇到了瓶颈，从而诞生了NoSQL，而对于大数据领域而言NoSQL用的较多的就是HBase。
HDFS存在高延迟访问。在Hadoop学习之路(六):理解Hadoop三大核心组件之HDFS一文中就已经指出HDFS存在高延迟访问的问题，所以为了解决这个HDFS与生俱来的短板，HBase是一个非常优秀的选择，HBase可以实现海量数据的随机定位和实时读写。

HBase是建立在Hadoop之上的NoSQL，是非关系型数据库，Hive是数据仓库，不是数据库。
HBase提供海量数据的随机定位和实时读写，毫秒级别内响应查询请求，Hive的查询并不能在短时间内响应。
HBase只提供数据的存储和查询功能，没有数据的处理能力，Hive提供类SQL的方式对数据进行处理，底层转变为MapReduce跑在YARN上。
Hive和HBase是两种基于Hadoop的不同技术，Hive是一种类SQL的引擎，并且运行MapReduce任务，Hbase是一种在Hadoop之上的NoSQL 的Key/Value数据库。

使用命令vim ~/.bash_profile,在该文件下添加一下两行配置,HBASE_HOME后是你解压HBase的目录：
```
export HBASE_HOME=
```

关注

专栏目录