Hive基础知识
1. Hive简介
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL的查询功能,其本质是将SQL转换成MapReduce的任务进行运算,底层由HDFS来提供数据的存储.
2. 特点
可扩展:Hive可自由的扩展集群的规模,一般情况下不需要重启服务
延展性:Hive支持用户根据需求来自定义函数
容错性:节点出现问题时SQL仍可完成执行(依赖于H...
原创
2018-11-06 18:23:49 ·
278 阅读 ·
0 评论