pig数据类型:
pig的基本数据类型是和java一样的
pig中有复杂的数据类型
map
tuple 元组:
以圆括号包裹,类似于sql里的一张表,元组中的数据类型可以任意,也可以指定,用以pig环境进行类型检查!
tuple长度固定,可以用下标取值!
bag:
bag是无序的,不能按下标去取,可以用foreach逐个获取!
NULL:
pig中null表示数据未知,或者是数据缺失,与c++,java的null不同!
模式:
- 模式是用来告诉pig,将要处理的数据时什么格式,对于多出的列,会自动丢弃,少的列用null填充
- as(a:int,b:chararry)
- 可以不指定类型,这时,类型是bytearray!
- 可以指定map,tuple,bag