用户浏览日志行为分析实例

这篇博客通过实例展示了如何分析用户浏览日志,包括获取用户在特定页面的起始和结束时间,并利用Hive的分析函数计算用户在页面的停留时间间隔,以及每个页面的总浏览时长和每个用户的总访问时长。
摘要由CSDN通过智能技术生成

用户浏览日志行为分析


用户在浏览网页过程中,在t1时刻,用户点进了p1页面,过一段时间后,用户又点进了p2页面,如此反复。
要求:统计用户在每个特定网页的停留时间
或是某个网页用户停留的总时间
步骤:
1、准备用户浏览日志数据 (user_log.txt: userid,log_time,log_url)
,并放置在一个目录下
在这里插入图片描述
2、在hive中创建存储用户浏览数据的数据表
在这里插入图片描述
在这里插入图片描述
3、将数据文件加载到hive表中 (注意:此处加载的/home/hduser/hive-data/user_log.txt路径是上面你放的路径,要一致)

在这里插入图片描述
在这里插入图片描述
4、获取用户在某个页面停留的起始与结束时间
在这里插入图片描述
在这里插入图片描述
5、计算用户在页面停留的时间间隔 (提示: unix_timestamp(string date, string pattern):将指定时间字符串格式字符串转换成Unix时间戳(以秒为单位),如果格式不对返回0。如:unix_timestamp(‘2009-03-20’, ‘yyyy-MM-dd’) = 1237532400,返回类型是bigint)
在这里插入图片描述
在这里插入图片描述
6、计算每个页面被浏览的总时长ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值