1. Hive是一个基于Hadoop的数据仓库工具,它提供了简单的SQL查询功能
2.支持批量插入,不支持单条插入
3.它是将简单的SQL语句转换成MapReduce程序来执行,创建的表可存放在hdfs或HBase上
4.hive倾向于用来分析数据,它只提供查询功能,不支持更新数据;
5.hive通过与jobtracker保持通信来初始化MapReduce任务,hive不会生成mapreduce程序,而是生成一个表示‘job执行计划’的XML文件,驱动内置的Mapper和Reduce模块;
6.因为hive是通过mapreduce程序来实现查询功能,所以有一定的查询延迟