1.执行模式
local mode
在本地模式下,Pig运行在单个JVM中,访问本地系统,适用于处理小规模数据集
% pig -x local
grunt>
MapReduce mode
2.数据关系
关系(relation)、包(bag)、元组(tuple)、字段(field)、数据(data)的关系
- 一个关系(relation)是一个包(bag),更具体地说,是一个外部的包(outer bag)。
- 一个包(bag)是一个元组(tuple)的集合。在pig中表示数据时,用大括号{}括起来的东西表示一个包——无论是在教程中的实例演示,还是在pig交互模式下的输出,都遵循这样的约定,请牢记这一点,因为不理解的话就会对数据结构的掌握产生偏差。
- 一个元组(tuple)是若干字段(field)的一个有序集(order