pig简单案例统计每个ip的访问次数

Pig的搭建

rpm -ivh *pig*.rpm #pig rpm包
source /etc/profile

本地模式 pig -x local 默认 mapreduce模式

Pig简单案例 pig latin语言 help查看

pig
grunt> copyFromLocal '/var/httpd/access_log /input/log.txt
grund> A = LOAD '/input/log.txt' USING PigStorage(' ') AS (ip,other);
grunt> group_ip = group A by ip;
grunt> result = foreach group_ip generate group,COUNT(A);
grunt> STORE result INTO 'output/group_ip_count';
grunt> cat /output/group_ip_count
or dump result 直接运行查看统计结果

A: 代表一个关系,一个表,一个变量,这个表中存放了所有ip记录
LOAD ‘/log.txt’ : 要加载的文件
USING PigStorage(’ ‘) : 使用空格作为分隔符
ip:others : 表中第一列名ip,数据类型其他类型

统计结果:

统计结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值