Pig
韩王-信
无成有终含章可贞
展开
-
Pig 12.0 发布
Pig 12.0 已经发布,根据发布文档中说这次主要增加了IN /CASE的操作,但是截至今天12.0的文档依然是旧的通编没有关于CASE的相关信息,估计还没有来得及更新。在APACHE的JIRA上找到了相关的信息,https://issues.apache.org/jira/browse/PIG-3280。 到此为止pig终于结束了没有分支语句的历史,在以往的版本中要想使用分支语句得写多个fil原创 2013-10-16 11:02:24 · 628 阅读 · 0 评论 -
pig 次数统计和列传行
b= foreach a generate TOKENIZE(line) as word;({(air),(2013),(us),(eu),(20)})({(air),(2013),(us),(eu),(30)})({(air),(2012),(us),(eu),(40)})({(hotel),(2013),(us),(eu),(20)})({(hotel),(2013原创 2013-09-29 14:27:34 · 936 阅读 · 0 评论 -
pig Casting Relations to Scalars
grunt> describe b;b: {f: chararray,m: chararray,l: chararray}grunt> c = group b all;grunt> describe c;c: {group: chararray,b: {(f: chararray,m: chararray,l: chararray)}}grunt> d = foreach原创 2013-09-29 11:05:36 · 835 阅读 · 0 评论 -
pig Disambiguate Operator
a = load '/usr/egencia/go.txt' AS name:tuple(f:chararray,m:chararray,l:chararray);grunt> describe a;a: {name: (f: chararray,m: chararray,l: chararray)}grunt> b = foreach a generate FLATTEN(n原创 2013-09-29 10:27:12 · 691 阅读 · 0 评论 -
pig测试数据
hdfs上的数据源如下:grunt> cat /usr/egencia/travler/2.txtair:343;hotel:45;train:54467;nation:chinaair:367;hotel:456;train:5567;nation:chinaair:356;hotel:4522;train:54367;car:454;nation:chinaair:343原创 2013-09-23 17:19:32 · 1645 阅读 · 0 评论