场景:
互联网软件跟踪收集用户的操作行为,从而对软件进行更加合理和人性化的修改和设计,例如chrome浏览器中用户最常用的按钮是哪些,浏览器中的按钮位置该如何排放?这些都需要收集用户的操作行为进行统计分析,最后确定浏览器的按钮如何排放,如何更加方便用户,让用户感觉很亲近,这点很重要哦^_^,用户很可能因为你的浏览器的某个功能很方便才会长久的使用下去(至少我是这样的)
既然需要收集用户的操作行为等信息,那这个的数据量是巨大的,每个用户打开浏览器可能操作上百次甚至上千次,再加上数以万计的用户操作,数据量可想而知。
对于这个大量数据插入,并且需要进行数据分析的场景,我认为这正是hbase的长处
下面做个简单的表设计
设计两张表:
1) monitor_item 行键 : monitor_id 列族:info: 列: name(值为监控项名称) 2)opreation_log: 行键 : monitor_id 列族:user: 列: ip (用户的访问ip,以竖线分隔) 列: version(用户使用的版本,以竖线分隔) 分析过程: 1.在monitor_item表中添加需要监控的列表
2.将浏览器返回的信息插入到操作记录中
3.根据行键monitor_id查询获得用户的操作ip,然后进行去重操作,即可统计各个按钮的使用数量
4.根据行键monitor_id查询获得用户的操作ip和version,根据ip进行去重操作,即可统计用户中软件各个版本的使用情况
|
Hbase案例:浏览器用户行为分析
最新推荐文章于 2024-01-25 01:55:24 发布