以前公司有同事讲过pig的各种使用经验,但是我觉得吧,工程的东西很多都是熟能生巧的过程,长时间不用就又忘记了。
这几天再从新使用pig,除了看thrift文件了解各个数据的结构之外,如果想看内部的有些信息,尤其是有些数据是会转换的,那就加载数据后,用describe,Returns the schema of a relation.看到pig的官方解释,就知道了,这个describe能够帮你了解数据的schema,这样你再去具体处理里面的每一个schema或者继续对其中的每一个点也可以Describe。终于感觉没有那么雾里看花了。