Apache的猪是通过一个叫PigLatin语言的大型数据集并行分析的平台。有关猪的更多信息,请参见猪项目页面。
一旦安装了猪,可执行文件位于:/ opt/mapr/pig/pig- <VERSION> / bin中/猪
确保环境变量JAVA_HOME
是否设置正确。例如:
安装猪
以下过程使用的操作系统软件包管理器,从MAPR存储库下载并安装猪。有关设置生态系统库(包括猪)的说明,请参阅准备包和存储库。
如果你想从包文件手动安装此组件,请参阅包和依赖关系为MAPR软件。
要在Ubuntu的群集上安装猪:
- 执行以下命令以
根
或使用sudo的
。 - 此过程是将一个MAPR集群上执行。如果你还没有安装MAPR,请参见安装指南。
- 更新可用软件包列表:
- 在每个计划的猪节点,安装
MAPR猪
:
到Red Hat或CentOS的群集上安装猪:
- 执行以下命令以
根
或使用sudo的
。 - 此过程是将一个MAPR集群上执行。如果你还没有安装MAPR,请参见安装指南。
- 在每个计划的猪节点,安装
MAPR猪
:
入门猪
在本教程中,我们将使用0.11版本的猪猪运行计数的单词的文件中的MapReduce作业/中/ constitution.txt
在MAPR
在群集上用户的目录,并将结果存储在文件wordcount.txt
。
- 首先,确保你已经下载的文件:在页面的MAPR虚拟机的巡回赛,选择工具>附件,然后右键单击constitution.txt保存它。
- 请确保该文件被加载到集群中,在目录
/用户/ MAPR /中
。如果你不知道怎么样,看看NFS上的教程的MAPR虚拟机的巡回赛。
打开猪壳,并开始:
- 在终端,键入命令
猪
来启动猪壳。 - 在
咕噜>
提示符下,键入以下命令行(每个后按Enter键):constitution.txt
。 - 当MapReduce作业完成后,键入
退出
,退出的猪壳,并看看该目录中的内容/ myvolume / wordcount的
看到的结果。