1 Hive 最适合于数据仓库应用程序,使用该应用程序进行相关的静态数据分析,不需要快速响应给出结果,而且数据本身不会频繁变化。
hive 不是一个完成的数据库。Hadoop以及HDFS的设计本身约束和局限性地限制了Hive所能胜任的工作。
其中最大的限制就是hive不支持记录级别的更新、插入或者删除操作。
但是用户可以通过查询生成新表或者将查询结果导入到文件中。
同时,因为Haddop是一个面向批处理的系统,而MaReduce任务(job)的启动过程需要消耗较长的时间,所以hie查询延迟比较严重。
在hive中,即使查询数据集相对较小,往往也需要执行更长的时间。
hive不支持事务。
因此,Hive不支持OLTP(联机事务处理)所需的关键功能,而更接近成为一个OLAP(联机分析技术)工具。
如果用户需要对大规模数据使用OLTP功能的话,那么应该选择使用一个NoSql数据库,
例如,和Hadoop结合使用的HBase及Casandra。
因此,Hive是最适合数据仓库应用程序的,其可以维护海量数据,而且可以对数据进行挖掘,然后形成意见和报告等。