1、pig安装
安装包:
上传到master上:
解压pig安装包:
2、配置pig
配置pig环境变量:
插入PIG_HOME路径:
3、mapreduce模式
验证mapreduce模式:
案例:用pig计算网站访问日志的访问次数
数据文件:
上传数据文件到集群上:
pig命令计算案例访问次数:
案例结果:
对案例结果进行排序:
排序结果: