在Hadoop1.2.1分布式集群环境下安装pig0.12
● 前言:
1. 大家最好通读一遍过后,在理解的基础上再按照步骤搭建。
2. 之前写过几篇文章是关于Hadoop家族安装系列的,后续还会有其它内容,敬请期待!
3. 好记性不如烂笔头,最近突然想把自己学习的东西整理出来,一则服务大众,二则以后好查阅。由于水平有限,难免有错误,请多谅解并指正,如有什么问题可以留言咨询。
一、推荐阅读文章
《Hadoop家族安装系列(1)——Hadoop1.2.1分布式安装》
《Hadoop家族安装系列(2)——安装Mahout0.9框架》
二、前提条件
Hadoop1.2.1分布式集群环境搭建成功,并且Hadoop集群服务器正常运行。
三、所需环境与软件
1. Hadoop分布式集群环境:
见《Hadoop家族安装系列(1)——Hadoop1.2.1分布式安装》。
2. Pig0.12: pig-0.12.0.tar.gz
四、安装和配置
1. 下载pig-0.12.0.tar.gz,并使用以下命令解压后,移动到opt目录下。
tar -zxvf pig-0.12.0.tar.gz (解压后文件夹为:pig-0.12.0)
sudo mv pig-0.12.0 /opt/pig-0.12.0
2. 配置环境变量
如(图1)所示,使用命令 sudo gedit /etc/profile 打开文件后,在文件最后面加入:
export PIG_HOME=/opt/pig-0.12.0
export PIG_CLASSPATH=${HADOOP_HOME}/conf
export PATH=${PATH}:${PIG_HOME}/bin
(图1)
备注:最后要使用命令:source /etc/profile 使环境变量立即生效。
五、运行与测试
有二种运行方式:
1. 本地运行
命令: pig -x local
出现如(图2)所示页面,说明本地运行成功。
(图2)
2. 集群运行
(1). 启动hadoop集群,如(图3)所示。
使用命令: start-all.sh 启动hadoop集群。
使用命令: jps 查看是否启动成功。
(图3)
(2). pig集群运行
命令: pig
出现如(图4)所示页面,说明本地运行成功。
(图4)
3. 成功了,虽然很简单,还是高兴一下。