Hive安装部署

最新推荐文章于 2024-10-02 00:04:29 发布

wangys2006

最新推荐文章于 2024-10-02 00:04:29 发布

阅读量519

点赞数 6

分类专栏：大数据技术与架构应用软件系统技术与架构文章标签： hive hadoop 数据仓库

本文链接：https://blog.csdn.net/uesowys/article/details/138254769

版权

94 篇文章 1 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

Apache Hive是一个基于Hadoop分布式文件系统、使用MapReduce算法执行大规模离线数据分析的数据仓库，本文主要描述Hive的安装部署。

如上所示，Hive总体应用架构图，其中，Hive基于HBase或者使用Hadoop分布式文件系统执行MapReduce的分布式计算

如上所示，Hive执行离线数据分析的总体流程图，其中，主要流程包括Hive解析SQL、Hive生成SQL的执行计划、Hadoop生成执行任务、Hadoop使用MapReduce分布式计算执行数据分析任务、Hive数据仓库的元数据信息存储在METASTORE中

MySQL Server Master	192.168.0.130
MySQL Server Slave	192.168.0.131
MySQL Server Slave	192.168.0.132
NameNode1 Master ZooKeeper1 HBase Master	192.168.0.136
DataNode1 NameNode2 Slave ZooKeeper2 HBase Master Backup RegionServer1	192.168.0.137
DataNode2 ZooKeeper3 ReginServer2	192.168.0.138
DataNode3 RegionServer3	192.168.0.139