Apache Pig是用来处理大规模数据的高级查询语言,配合Hadoop使用,可以在处理海量数据时达到事半功倍的效果,比使用Java,C++等语言编写大规模数据处理程序的难度要小N倍,实现同样的效果的代码量也小N倍。
我根据自己在工作中的学习和总结,写了如下一些Apache Pig中文教程,供大家参考。
文章来源:http://www.codelast.com/
(1)《Apache Pig的一些基础概念及用法总结(1)》
(2)《Apache Pig的一些基础概念及用法总结(2)》
(4)《使用Apache Pig时应该注意/避免的操作或事项》
(5)《如何用Apache Pig输出压缩格式的SequenceFile》
文章来源:http://www.codelast.com/