1、Hive是什么?
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
2、本质是什么?
将SQL转换为MR程序
3、主要用途有哪些?
用来做离线数据分析,比直接用MR开发的效率更高。
4、Hive组件
用户接口
元数据存储
解释器、执行器、优化器
5、Hive与Hadoop的关系
基于HDFS进行数据存储,利用MR进行分析。
注:hive延迟比较大,主要用于离线分析
6、Hive与传统数据库的区别?
传统的数据库是面向事务处理的,Hive是面向分析的