Pig 安装配置过程还是很简单的,在已有的
Hadoop 集群环境(需要首先安装hadoop和配置hadoop环境变量)
下具体的操作过程如下:
1、安装版本
pig-0.11.1
2、安装目录
/usr/local/pig-0.11.1
3、安装步骤
下载
pig-0.11.1
到/usr/local/
cd
/usr/local/
tar -zxf pig-0.11.1
4、配置环境变量
vi /etc/profile
export HADOOP_HOME=/usr/local/hadoop-x.x.x
export PATH=$HADOOP_HOME/bin:$PATH
export PIG_INSTALL=/usr/local/pig-0.11.1
export PIG_CLASSPATH=$HADOOP_HOME/conf
export PATH=$PATH:$PIG_INSTALL/bin:$PIG_CLASSPATH
source /etc/profile
5、启动pig交互环境
pig -x local ----本地
pig ----集群map-reduce
6、pig -help
此外,在配置环境变量的过程中,我们配置了 PIG_CLASSPATH 环境变量,就要让 Pig 软件找到 Hadoop 集群,这里是告诉 Pig 软件 Hadoop 的配置文件在哪里,通过一系列配置文件可以找到关键参数 NameNode 和 JobTracker 的位置以及端口信息,有了这些信息就可以对整个集群进行控制了。我们也可以通过编辑 Pig 软件的 conf/pig.properties 文件来启动 MapReduce 模式。