HIVE是什么?
Hive是hadoop上处理结构化数据的数据仓库基础工具,用来处理存储在hadoop上的海量数据,使用hive可以使查询和分析变得更简单。
Hive起初是有facebook开发,后来贡献给apache基金会的,apache对它做了进一步的开发并开源。
Hive不合适做哪些事情?
1.hive不是一个关系型数据库
2.Hive不适合做为在线事务处理(OLTP)的系统
3.Hive不适合做实时查询和行级更新的操作
Hive特点:
1.在HDFS上处理数据,但是元数据通常保存在关系型数据库中
2.Hive被设计用来处理离线数据分析(OLAP)
3.Hive提供了类似sql类型的语言HiveQL(HQL)用来进行查询操作。
4.Hive具有易懂,快速,可伸缩,可扩展的特性
Hive的体系结构
以下组件图描绘了hive的体系