1 概述
1.1 是什么是Hive
Hive:由Facebook开源用于解决海量结构化日志的数据统计。
Hive是一种数据仓库软件,使用SQL来促进对分布式设备上存储的大体量的数据集进行读,写和管理!
SQL(结构化查询语言),使用SQL的前提是需要有一张表!
Hive分析数据必须可以映射为一个表结构!
Hive提供了JDBC驱动和命令行工具,让用户连接Hive!
Hive基于Hadoop,用来分析Hadoop上存储的结构化数据!
本质是:将HQL转化成MapReduce程序
1)Hive处理的数据存储在HDFS
2)Hive分析数据底层的实现是MapReduce
3)执行程序运行在Yarn上
1.2 Hive的特征
Hive不是一个关系型数据库
Hive不是基于OLTP设计!
Hive不支持实时查询和行级别更新!
Hive在关系型数据库存储元数据,处理的数据存储在hadoop!
Hive基于OLAP设计
Hive提供