Hadoop笔记之十——利用hive统计uv、pv的简单思路

这篇笔记写的时间久了,具体的东西找不到,但是一下内容提供的流程可以供各位小白参考

 

0、统计每个时段网站的PV和UV
hive (db_track)> select date,hour,count(url) pv,count(distinct guid) uv from track_log group by date,hour ;
date    hour    pv    uv
20160624    18    64972    23938
20160624    19    61162    22330
    
1、Hive中创建结果表:
create table db_track.daily_hour_visit(
date string,
hour string,
pv string,
uv string
)
row format delimited fields terminated by "\t" ;

2、结果写入Hive表(这里最好使用shell脚本去做):
hive (db_track)> insert overwrite table db_track.daily_hour_visit select date,hour,count(url) pv,count(distinct guid) uv from track_log group by date,hour ;

3、创建crontab命令,每天定时调度shell脚本

4、mysql中创建一张表,永久存储分析结果
mysql> create table visit(
    -> date int,
    -> hour int,
    -> pv bigint,
    -> uv bigint
    -> ) ;


5、利用sqoop导入数据到Mysql(这条执行语句也可以放到crontab里面每天自动执行)
$ bin/sqoop --options-file job1/visit.opt 

mysql> select * from visit ;
+----------+------+-------+-------+
| date     | hour | pv    | uv    |
+----------+------+-------+-------+
| 20160624 |   18 | 64972 | 23938 |
| 20160624 |   19 | 61162 | 22330 |
+----------+------+-------+-------+
 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值