Hive的变量前面有一个命名空间,包括hiveconf、system、env,还有一个hivevar
1.hiveconf的命名空间指的是hive-site.xml下面的配置变量值。
2.system的命名空间是系统的变量,包括JVM的运行环境。
3.env的命名空间,是指环境变量,包括Shell环境下的变量信息,如HIVE_HOME之类的。
在Linux终端声明变量可以使用
--define key=value或者是--hivevar key=value来声明,这都代表是hivevar的变量。
如:
# hive --define a='love'
可以简写为:
hive -d key=value;
另外一种声明方式为:hive --hivevar key=value
添加多个变量的时候如下:
# hive --define a='love' --define b='you'
对于使用hivevar定义的变量前缀可有可无,如:
hive> create table toss1(i int, ${hivevar:foo} string);
等价于:
hive> create table toss2(i2 int, ${foo} string);
注:对于使用命名空间如hiveconf、system、env的,前缀则不可少。
如果在Hive终端,我们可以直接通过set来定义变量:
set;或者set-v
注:只在hive终端输入set或者是set -v 可以查看现有环境的所有变量的值。加上-v参数,可以获取到HDFS和MapReduce的环境变量信息。
通过${hiveconf:val}获取。
下面通过一个简单的示例来深入体会:
hive (hive)> set val=lavimer;
hive (hive)> set val;
val=lavimer
hive (hive)> select * from employees where name='${hiveconf:val}';
如图: