Apache Hive—命令行&参数配置方式

最新推荐文章于 2023-11-01 21:46:14 发布

anniewhite

最新推荐文章于 2023-11-01 21:46:14 发布

阅读量189

点赞数

分类专栏：大数据文章标签：大数据 hadoop hive 数据仓库

本文链接：https://blog.csdn.net/anniewhite/article/details/105323447

版权

大数据专栏收录该内容

18 篇文章 3 订阅

订阅专栏

Hive参数配置

Hive命令行

输入$HIVE_HOME/bin/hive -H或者-help可以显示帮助选项。
说明：
1、-i 初始化HQL文件。
2、-e 从命令行执行指定的HQL
3、-f 执行HQL脚本
4、-v 输出执行的HQL语句到控制台
5、-p connect to Hive Server on port number
6、-hiveconf x=y Use this to set hive/hadoop configuration variables.
参数范围只对本次运行有效。

例如：

$HIVE_HOME/bin/hive -e 'select * from tab1 a'
$HIVE_HOME/bin/hive -f /home/my/hive-script.sql
$HIVE_HOME/bin/hive -f hdfs://<namenode>:<port>/hive-script.sql 
$HIVE_HOME/bin/hive -i /home/my/hive-init.sql 
$HIVE_HOME/bin/hive -e 'select a.col from tab1 a'
	--hiveconf hive.exec.compress.output=true
	--hiveconf mapred.reduce.tasks=32

在这里插入图片描述

Hive参数配置方式

Hive参数大全：
https://cwiki.apache.org/confluence/display/Hive/Configuration+Properties
开发Hive应用时，不可避免地需要设定Hive的参数。设定Hive的参数可以调优HQL代码的执行效率，或帮助定位问题。然而实践中经常遇到的一个问题是，为什么设定的参数没有起作用？这通常是错误的设定方式导致的。
对于一般参数，有以下三种设定方式：
配置文件（全局有效）
命令行参数（对hive启动实例有效）
参数声明（对hive的链接session有效）

hive执行引擎：
hive.execution.engine
可以不用mr做执行引擎，用spark做执行引擎。可以做相关设置修改。
在这里插入图片描述
设置分桶查询：
mapred.reduce.tasks
默认值是-1

配置文件

用户自定义配置文件：$HIVE_CONF_DIR/hive-site.xml
默认配置文件：$HIVE_CONF_DIR/hive-default.xml
用户自定义配置会覆盖默认配置。
另外，Hive也会读入Hadoop的配置，因为Hive是作为Hadoop的客户端启动的。Hive的配置会覆盖Hadoop的配置。
配置文件的设定对本级启动的所有Hive进程都有效。

命令行参数

启动Hive（客户端或Server方式）时，可以在命令行添加-hiveconf来设定参数
例如添加日志级别：bin/hive -hiveconf hive.root.logger=INFO,console
设定对本次启动的Session（对于Server方式启动，则是所有请求的Sessions）有效。

参数声明

可以在HQL中使用SET关键字设定参数，这一设定的作用域也是session级的。
比如：

set hive.exec.reducers.bytes.per.reducer=<number> 每个reduce task的平均负载数据量
set hive.exec.reducers.max=<number> 设置reduce task数量的上限
set mapreduce.job.reduces=<number> 指定固定的reduce task数量

但是，这个参数在必要时<业务逻辑决定只能用一个reduce task>hive会忽略

上述三种设定方式的优先级依次递增，即参数声明覆盖命令行参数，命令行参数覆盖配置文件设定 。注意某些系统级的参数，例如log4j相关的设定，必须用前两种方式设定，因为那些参数的读取在Session建立以前已经完成了。

anniewhite

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Apache Hive—命令行&参数配置方式

目录Hive参数配置Hive命令行Hive参数配置方式配置文件命令行参数参数声明Hive参数配置Hive命令行输入$HIVE_HOME/bin/hive -H或者-help可以显示帮助选项。说明：1、-i 初始化HQL文件。2、-e 从命令行执行指定的HQL3、-f 执行HQL脚本4、-v 输出执行的HQL语句到控制台5、-p connect to Hive Server o...
复制链接

扫一扫