hive篇

本文详细探讨了Hive如何转化为MapReduce任务,解释了Hive SQL的逻辑执行计划优化过程,包括如何创建动态分区和索引。此外,还介绍了Hive的调度方法,列式存储格式ORC和Parquet的优势,以及数据建模中的星型、雪花型和星座型模型。同时,文章讲解了数据仓库的建设方法,如BDM、FDM、GDM和ADM层次,并讨论了如何处理部门工资高的人的Shell脚本以及Hive解析JSON数据的挑战和解决办法。
摘要由CSDN通过智能技术生成

问题 1 说一下hive底层转为MapReduce ,底层是怎么转的

在这里插入图片描述

在这里插入图片描述

(3) 优化器(Query Optimizer):对逻辑执行计划进行优化。

> explain select * from mytest_staff_info_demo4_cp1 
> where statis_date='20180229'
> order by name
> limit 3;
OK
STAGE DEPENDENCIES:
Stage-1 is a root stage
Stage-0 is a root stage
STAGE PLANS:
Stage: Stage-1
Map Reduce
Map Operator Tree:
TableScan
alias: mytest_staff_info_demo4_cp1
Statistics: Num rows: 0 Data size: 195 Basic stats: PARTIAL Column
stats: NONE
Select Operator
expressions: name (type: string), deptcode (type: string), id (type:
int), account (type: string), areacode (type: string), statis_date (type: string)
outputColumnNames: _col0, _col1, _col2, _col3, _col4, _col5
Statistics: Num rows: 0 Data size: 195 Basic stats: PARTIAL Column
stats: NONE
Reduce Output Operator
key expressions: _col0 (type: string)
sort order: +
Statistics: Num rows: 0 Data size: 195 Basic stats: PARTIAL Column
stats: NONE
value expressions: _col0 (type: string), _col1 (type: string),
_col2 (type: int), _col3 (type: string), _col4 (type: string), _col5 (type:
string)
Reduce Operator Tree:
Extract
Statistics: Num rows: 0 Data size: 195 Basic stats: PARTIAL Column
stats: NONE
Limit
Number of rows: 3
Statistics: Num rows: 0 Data size: 195 Basic stats: PARTIAL Column
stats: NONE
File Output Operator
compressed: true
Statistics: Num rows: 0 Data size: 195 Basic stats: PARTIAL Column
stats: NONE
table:
input format: org.apache.hadoop.mapred.TextInputFormat

(4) 执行器(Execution):把逻辑执行计划转换成可以运行的物理计划。对于 Hive 来说,就是

MR/Spark。

可以使用 explain 命令,查看语法树,即 hive 先将 sql 语法转成对应的语法树

output format: 
org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat 
serde: org.apache.hadoop.hive.serde2.lazy
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值