一、Hive 概述
1、Hive 简介
Hive:由Facebook开源用于解决海量结构化日志的数据统计。
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
本质是:将HQL转化成MapReduce程序。
说明:
- Hive处理的数据存储在HDFS;
- Hive分析数据底层的实现是MapReduce;
- 执行程序运行在Yarn上;
1. 分布式文件系统HDFS存储架构与原理
HDFS结构与架构:
HDFS分布式文件系统架构:
Hive:由Facebook开源用于解决海量结构化日志的数据统计。
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
本质是:将HQL转化成MapReduce程序。
说明:
1. 分布式文件系统HDFS存储架构与原理
HDFS结构与架构:
HDFS分布式文件系统架构: