《Hive用户指南》-HiveSQL转化为MapReduce任务

本文介绍了Hive如何将HQL语句转化为MapReduce任务,重点解析了JOIN、GROUP BY、DISTINCT操作的转化过程,并展示了命令行运行结果。通过对`hive.fetch.task.conversion`参数的理解,帮助优化Hive查询性能。
摘要由CSDN通过智能技术生成


Hive是Facebook实现的一个开源的数据仓库工具——

  • Hive基于Hadoop实现,底层数据存放在HDFS中,计算(查询)使用MapReduce任务实现
  • 将结构化的数据文件映射为数据库表,并提供HQL查询功能,将HQL语句转化为MapReduce任务运行

关于Hive的介绍,可以参考我之前的笔记Hive简介、基本架构与存储结构。在实际应用中,我们主要通过编写HiveSQL来对数据进行查询等操作,本文介绍常用的HiveSQL如何转化为MapReduce任务,便于在编写SQL时写出更加高效的代码。

1. hive.fetch.task.conversion参数

在Hive中,有些简单任务既可以转化为MR任务,也可以Fetch抓取,即直接读取table对应的存储目录下的文件得到结果,具体的行为取决于Hive的hive.fetch.task.conversion参数。

hive-default.xml.template中,可以找到这个参数描述如下:

<property>
    <name>hive.fetch.task.conversion</name>
    <value>more</value>
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值