Pig-0.16.0的安装与配置

1. 下载pig并解压

2. 配置环境变量

## Pig
export PIG_HOME=/Users/eleme/Documents/ProgramFiles/apache-software-foundation/pig-0.16.0
export PATH=$PATH:$PIG_HOME/bin

这里Java环境变量的配置省略

3. 修改配置文件

打开/pig-0.16.0/conf/pig.properties文件,修改配置

pig.logfile=/home/hadoop/pig-0.16.0/log

 pig.logfile=/Users/eleme/Documents/ProgramFiles/apache-software-foundation/pig-0.16.0/log

4. 测试

测试是否安装成功

pig --help


4. 启动

pig -x mapreduce

pig -x lcoal

2.Pig执行模式
Pig有两种执行模式,分别为:
1)本地模式(Local)
本地模式下,Pig运行在单一的JVM中,可访问本地文件。该模式适用于处理小规模数据或学习之用。
运行以下命名设置为本地模式:

[plain] view plain copy  在CODE上查看代码片派生到我的代码片

  1. [jifeng@jifeng02 ~]$ pig -x local  
  2. which: no hadoop in (/home/jifeng/jdk1.7.0_45/bin:/home/jifeng/jdk1.7.0_45/bin:/home/jifeng/jdk1.7.0_45/bin:/usr/lib/qt-3.3/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/jifeng/bin:/home/jifeng/apache-ant-1.9.4/bin:/home/jifeng/hadoop/hive-0.12.0-bin/bin::/home/jifeng/hbase-0.94.21/bin:/home/jifeng/bin:/home/jifeng/apache-ant-1.9.4/bin:/home/jifeng/hadoop/hive-0.12.0-bin/bin::/home/jifeng/hbase-0.94.21/bin:/home/jifeng/pig-0.12.1/bin:/home/jifeng/bin:/home/jifeng/apache-ant-1.9.4/bin:/home/jifeng/hadoop/hive-0.12.0-bin/bin::/home/jifeng/hbase-0.94.21/bin:/home/jifeng/pig-0.12.0/bin)  
  3. Warning: $HADOOP_HOME is deprecated.  
  4.   
  5. 2015-08-16 22:57:09,716 [main] INFO  org.apache.pig.Main - Apache Pig version 0.12.0 (r1529718) compiled Oct 07 2013, 12:20:14  
  6. 2015-08-16 22:57:09,717 [main] INFO  org.apache.pig.Main - Logging error messages to: /home/jifeng/pig_1439737029715.log  
  7. 2015-08-16 22:57:09,735 [main] INFO  org.apache.pig.impl.util.Utils - Default bootup file /home/jifeng/.pigbootup not found  
  8. 2015-08-16 22:57:09,828 [main] INFO  org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: file:///  
  9. grunt>   

2)MapReduce模式
在MapReduce模式下,Pig将查询转换为MapReduce作业提交给Hadoop(可以说群集 ,也可以说伪分布式)。
应该检查当前Pig版本是否支持你当前所用的Hadoop版本。某一版本的Pig仅支持特定版本的Hadoop,你可以通过访问Pig官网获取版本支持信息。
Pig会用到HADOOP_HOME环境变量。如果该变量没有设置,Pig也可以利用自带的Hadoop库,但是这样就无法保证其自带肯定库和你实际使用的HADOOP版本是否兼容,所以建议显式设置HADOOP_HOME变量。且还需要设置PIG_CLASSPATH变量:

 

[plain] view plain copy  在CODE上查看代码片派生到我的代码片

  1. [jifeng@jifeng02 ~]$ vi .bash_profile  
  2.   
  3. # .bash_profile  
  4.   
  5. # Get the aliases and functions  
  6. if [ -f ~/.bashrc ]; then  
  7.         . ~/.bashrc  
  8. fi  
  9.   
  10. # User specific environment and startup programs  
  11.   
  12. PATH=$PATH:$HOME/bin  
  13.   
  14. export PATH  
  15. export JAVA_HOME=$HOME/jdk1.7.0_45  
  16. export PATH=$JAVA_HOME/bin:$PATH  
  17. export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar  
  18. export HADOOP_HOME=$HOME/hadoop/hadoop-1.2.1  
  19. export ANT_HOME=$HOME/apache-ant-1.9.4  
  20.   
  21. export HIVE_HOME=$HOME/hadoop/hive-0.12.0-bin  
  22. export HBASE_HOME=$HOME/hbase-0.94.21  
  23. export PIG_HOME=$HOME/pig-0.12.0  
  24. export PIG_CLASSPATH=$HOME/hadoop/hadoop-1.2.1/conf/  
  25.   
  26. export PATH=$PATH:$ANT_HOME/bin:$HIVE_HOME/bin::$HBASE_HOME/bin:$PIG_HOME/bin:$HADOOP_HOME/bin  
  27. ~  
  28. ~  
  29. ~  
  30. ".bash_profile" 24L, 661C 已写入                                                                                    
  31. [jifeng@jifeng02 ~]$ source .bash_profile  
  32. [jifeng@jifeng02 ~]$ pig  
  33. Warning: $HADOOP_HOME is deprecated.  
  34.   
  35. 2015-08-16 23:06:24,122 [main] INFO  org.apache.pig.Main - Apache Pig version 0.12.0 (r1529718) compiled Oct 07 2013, 12:20:14  
  36. 2015-08-16 23:06:24,123 [main] INFO  org.apache.pig.Main - Logging error messages to: /home/jifeng/pig_1439737584121.log  
  37. 2015-08-16 23:06:24,142 [main] INFO  org.apache.pig.impl.util.Utils - Default bootup file /home/jifeng/.pigbootup not found  
  38. 2015-08-16 23:06:24,281 [main] INFO  org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: hdfs://jifeng01:9000  
  39. 2015-08-16 23:06:24,463 [main] INFO  org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to map-reduce job tracker at: jifeng01:9001  
  40. grunt>   

3.运行Pig程序
Pig程序执行方式有三种:
1)脚本方式
直接运行包含Pig脚本的文件,比如以下命令将运行本地scripts.pig文件中的所有命令:
pig scripts.pig
2)Grunt方式
Grunt提供了交互式运行环境,可以在命令行编辑执行命令。
Grund同时支持命令的历史记录,通过上下方向键访问。
Grund支持命令的自动补全功能。比如当你输入a = foreach b g时,按下Tab键,则命令行自动变成a = foreach b generate。你甚至可以自定义命令自动补全功能的详细方式。具体请参阅相关文档。
3)嵌入式方式
可以在java中运行Pig程序,类似于使用JDBC运行SQL程序。
Pig Latin编辑器
PigPen是一个Ecliipse插件,它提供了在Eclipse中开发运行Pig程序的常用功能,比如脚本编辑、运行等。下载地址:http://wiki.apache.org/pig/PigPen
其他一些编辑器也提供了编辑Pig脚本的功能,比如vi等。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值