Hbase是什么?
Hbase是一个架构在Hdfs文件系统上的列式存储,是开源的,分布式,面向列的数据库。适合于非结构化数据存储的数据库。
Hbase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统,可以在廉价的PC Server搭建大规模结构化存储集群.
1,HBase位于Hadoop生态系统的结构化存储层。
image
2,HDFS作为其底层的文件存储
3,MapReduct为Hbase提供高性能的计算能力
4,Zookeeper为HBase提供了稳定的服务和failover的能力
image
Hive是什么?
hive是一个基于Hadoop的一个数据仓库工具。可以将结构化数据映射为一张数据库表,并且提供sql的查询能力,可以将sql换换为MapReduce任务进行。
下面我们看看Hive的架构图:
1,用户接口,hive主要有三个接口,CLI(CLI启动的时候会同时气筒一个Hive的副本),Client(hive的客户端,连结hive server),web UI(通过浏览器访问)
2,元数据存储,hive将元数据存储在数据库中如:mysql。
3,Driver(解释器、编译器、优化器、执行器):完成词法分析,语法分析,优化,编译,优化以及查询计划的生成,随后由MapReduce使用。
4,Hado