pig下载
pig版本的选择非常重要!!!
因为pig不同版本支持的hadoop版本不同,很容易因为版本不同导致错误。直接上图说明
上图可以看到,官网针对每个pig适用的hadoop版本都做了说明,所以版本选择很重要。
我用的是hadoop1.0.0。按照官网的说法,最新的pig0.17.0都是可以使用的,但是我下载下来安装后,就直接报错,经过一番尝试,最高能用的版本是pig0.12.0。坑爹!!!!
pig官网:http://pig.apache.org/ 进去后,按照下面的步骤:
进去后就是一些下载的镜像网站,随便选一个,如果发现下载速度太慢就换一个。
这里只能看到最新的pig0.16.0和pig0.17.0版本,但是1标记的地方是旧版本的链接
点击1处的链接,去下载旧版本。
我下载的是pig0.12.0
下载完成。
pig安装
解压:
tar -zxvf pig-0.12.0.tar.gz
移动到合适的位置,你自己觉得哪里合适放哪里
我是放在/usr/local下
mv pig-0.12.0 /usr/local/pig-0.12.0
配置环境变量,pig安装的前提是你成功的安装hadoop,当然也可以不安装,pig会使用自己捆绑的hadoop,不过我没试过,我是自己安装了hadoop1.0.0。
pig要配置的环境变量不多,写在/etc/profile或者~/.bashrc中都可以,我是写在~/.bashrc中的,内容如下:
# pig
export PIG_HOME=/usr/local/pig-0.12.0
export PIG_CLASSPATH=$