第8周 Pig安装与Pig Latin语言，应用案例

最新推荐文章于 2024-03-31 15:06:57 发布

事后诸葛亮

最新推荐文章于 2024-03-31 15:06:57 发布

阅读量2.4k

点赞数

分类专栏： nosql

本文链接：https://blog.csdn.net/zq9017197/article/details/18304059

版权

nosql 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

pig 简介

Pig可以看做hadoop的客户端软件，可以连接到hadoop集群进行数据分析工作

Pig方便不熟悉java的用户，使用一种较为简便的类似于SQL的面向数据流的语言pig latin进行数据处理

Pig latin可以进行排序、过滤、求和、分组、关联等常用操作，还可以自定义函数，这是一种面向数据分析处理的轻量级脚本语言

Pig可以看做是pig latin到map-reduce的映射器

安装pig

下载并解压pig安装包（ http://pig.apache.org/）

设置环境变量

进入grunt shell验证

Pig工作模式

本地模式：所有文件和执行过程都在本地，一般用于测试程序

Mapreduce模式：实际工作模式

[root@hadoop1 pig]# tar zxf pig-0.9.2.tar.gz

[root@hadoop1 pig]# cd pig-0.9.2/bin/

[root@hadoop1 bin]# ./pig -x local

which: no hadoop in (/usr/jdk1.7.0_09/bin:/usr/kerberos/sbin:/usr/kerberos/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin)

2014-01-14 05:07:52,637 [main] INFO org.apache.pig.Main - Logging error messages to: /nosql/pig/pig-0.9.2/bin/pig_1389694072631.log

2014-01-14 05:07:52,855 [main] INFO org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: file:///

grunt> quit

[root@hadoop1 bin]#

#配置pig的map-reduce模式

#JAVA_HOME要设置为JDK的上级目录，之前安装hadoop是配置过JAVA_HOME的，这里需要改一改。

#PATH里面一定要加hadoop的bin目录和pig的bin目录。

[root@hadoop1 ~]# vi .bash_profile

export PATH=$PATH:/nosql/hadoop/hadoop-0.20.2/bin:/nosql/pig/pig-0.9.2/bin

export JAVA_HOME=/usr

export PIG_CLASSPATH=/nosql/hadoop/hadoop-0.20.2/conf

#设置完成后重新登录使环境变量生效

#在用pig连接之前需要先启动hadoop集群

[root@hadoop1 ~]# pig

2014-01-14 05:29:39,444 [main] INFO org.apache.pig.Main - Logging error messages to: /root/pig_1389695379442.log

2014-01-14 05:29:39,726 [main] INFO org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: hdfs://hadoop1:9000

2014-01-14 05:29:39,896 [main] INFO org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to map-reduce job tracker at: hadoop1:9001

grunt> quit

[root@hadoop1 ~]#