- 简单、容易上手
- 为超大数据集设计的计算/扩展能力
- 统一的元数据管理
Hive数据存放在HDFS上,元数据信息是存放在Mysql中,元数据{(表名字、表字段、表字段类型、存放在HDFS的位置)记录数据的数据。}
SQL on hadoop :Hive、Spark SQL、impala…
构建于Apache Hadoop之上,提供以下功能:
通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提取/转换/加载(ETL),报告和数据分析。
一种在各种数据格式上强加结构的机制
访问直接存储在Apache HDFS 或其他数据存储系统(如Apache HBase )中的文件
通过Apache Tez , Apache Spark 或 MapReduce执行查询
使用HPL-SQL的过程语言
通过Hive LLAP,Apache YARN和Apache Slider进行亚秒级查询检索。
Hive在Hadoop生态系统中的位置