Hive
文章平均质量分 81
weixin_37889021
这个作者很懒,什么都没留下…
展开
-
深入浅出Hive(二)
1. Hive工作原理详解1.1 部件元存储(Metastore):存储“系统目录以及关于表、列、分区等的元数据”的组件,可以通过thrift接口查询得到,由于需要快速的提供到编译器中,所以使用关系型数据库管理系统(RDBMS)。驱动(Driver):控制HiveQL生命周期的组件,当HiveQL查询穿过Hive时。该驱动管理着会话句柄以及任何会话的统计。查询编译器(Query Compiler)...原创 2018-04-24 16:58:14 · 318 阅读 · 0 评论 -
深入浅出Hive(一)
1. Hive简介1.1 Hive数据仓库软件提供对存储在分布式中的大型数据集的查询和管理,它本身是建立在Apache Hadoop之上,主要提供以下功能:它提供了一系列的工具,可用来对数据进行提取/转化/加载(ETL);是一种可以存储、查询和分析存储在HDFS(或者HBase)中的大规模数据的机制;查询是通过MapReduce来完成的,但并不是所有的查询都要通过MapReduce完成;因此,Hi...原创 2018-04-20 18:34:28 · 172 阅读 · 0 评论