Hive
what:数据仓库,
解释器,编译器,优化器,可以将sql转化成MapReduce,
Hive 将元数据存储在数据库中,如 mysql、derby,元数据包括表的名字、表的列和分区、及其属性、表的属性、表数据的位置
表数据存储在HDFS中,大部分的查询、计算都由MapReduce完成(包含*的查询不会生成MapReduce任务)
why:非java编程者对hdfs的数据做mapreduce操作
how:将sql转化为mapreduce,任务提交给hadoop
create table psn(id int,name string);
insert into psn values(1,'qimingwei'); 会转成mapreduce
select * from psn; select *不会转成mapreduce
insert操作还有count();max();等聚合函数都会转成mapreduce操作