用户浏览日志行为分析
用户在浏览网页过程中,在t1时刻,用户点进了p1页面,过一段时间后,用户又点进了p2页面,如此反复。
要求:统计用户在每个特定网页的停留时间
或是某个网页用户停留的总时间
步骤:
1、准备用户浏览日志数据 (user_log.txt: userid,log_time,log_url)
,并放置在一个目录下
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/03c54a435f3805d6db07fcf02804c60c.png)
2、在hive中创建存储用户浏览数据的数据表
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/f6925f96fab21ebabe39b04b2647cce7.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/4f9a0997223a33886d56a4deca430dfb.png)
3、将数据文件加载到hive表中(注意:此处加载的/home/hduser/hive-data/user_log.txt路径是上面你放的路径,要一致)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/54fd42f08878d089189b63c0e36e6efc.png)