由于工作中需要使用Pig工具,为了加深对Pig的理解,现在尝试分析它的源代码,以最新发布的0.13.0版为基础。
Pig是什么,源代码怎样获取,我就不多说了,Google或百度一下即可找到。
拿到源代码后,首先统计java文件的个数,总共有1504个!!!
这么多代码还要继续分析吗?当然要继续了,不要怕,其实里面很多辅助文件和小文件。
比如以Test开头的文件,绝大多数是用来进行单元测试的,跟核心代码无关,可以删除掉;有很多文件只是简单的定义了一个接口,没有多少内容。
在这里我推荐使用Everything这个文件查询工具来进行文件的统计和过滤,非常方便。
删除掉Test文件后,还剩1157个,少了300多个,请看下图。
为下一步开始分析代码开了一个好头。