本文基本涵盖以下内容:
-
一、基于Hadoop的数据仓库Hive基础知识
-
二、HiveSQL语法
-
三、Hive性能优化
-
四、Hive性能优化之数据倾斜专题
-
五、HiveSQL优化十二板斧
-
六、Hive面试题(一)
-
七、Hive/Hadoop高频面试点集合(二)
基于Hadoop的数据仓库Hive基础知识
Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。
一、概述