实验环境,已经安装了hadoop,先做的分布式实验,pig解压缩在/home/hadoop目录下,完成实验没有任何问题。
实验内容:在pig-0.9.2/tutorial目录下,pigtutorial.tar.gz文件解压缩,如果没有,用ant先编译。主要分析excite-small.log文件。
该文件的内容格式是UserId TimeStamp SearchQuery
ant安装参考:http://blog.csdn.net/fumier/article/details/42394133
编译过程:直接转到tutorial目录下,ant即可。
1、启动hadoop,hadoop/bin start-all.sh
2、启动后输入pig -x local进入本地模式
3、输入
log =load 'excite-small.log' as (user,time,query);
lmt =limit log 4; 选取前四条信息
dump lmt; 输出
4、结果如下所示