Pig入门-环境搭建
本文介绍在Linux RedHat + Hadoop2.2.0+JDK1.7的环境下安装pig-0.14.0.
一、pig安装包下载
下载地址: http://mirrors.hust.edu.cn/apache/pig/pig-0.14.0/
二、安装及配置
1)解压至安装目录
比如: tar -zxvf pig-0.14.0.tar.gz -C /itcast
2) 配置
编辑 .bash_profile文件
添加
export PIG_INSTALL=/itcast/pig-0.14.0
export PIG_CLASSPATH=$HADOOP_HOME/conf/
export PATH=$PATH:$PIG_INSTALL/bin
三、测试
列出当前操作系统中的所有用户
1)将/etc/passwd拷贝至/root目录;
2)运行 pig -x local3)将passwd文件内容装载到pig;
grunt> A = load 'passwd' using PigStorage(':');
4)提取用户名字段;
grunt> B = foreach A generate $0 as id;
5)显示结果。
grunt> dump B;