Hadoop之网站流量日志数据分析

本文介绍了利用Hadoop对网站流量日志进行分析的过程,包括点击流数据模型的建立,日志数据的收集与处理,以及流量分析的各种维度,如用户访问量、页面访问情况、转化路径等。通过数据清洗、入库和分析,揭示了网站流量的来源、行为特征和转化效率。
摘要由CSDN通过智能技术生成

网站流量日志数据分析系统

点击流数据模型

点击流是指用户在网站上持续访问的轨迹,按照时间来进行先后区分,基本上所有大型网站都有日志埋点。通过js的方式,可以获得用户在网站上所访问的内容,包括url。埋点收集过来的数据,都发送到日志服务器,一条日志大概1KB。然后分析用户的点击数据,得到我们的点击流模型。

日志数据例子:192.168.52.100 a.html2018-11-20 11:20:20
可以分析计算有多少用户访问?一共访问多少页面?平均一个用户访问多少页面?页面停留时间?等等问题,可以把访问数据模型转化成以下两种模型:

PageView模型: 重视每一个页面访问情况
Visit模型: 重视每一个页面访问情况

流量分析包括内容分析、转化分析是一个内涵丰富的体系,整体过程是一个金字塔结构,金字塔顶部是网站的目标:投资回报率ROI

网站流量模型分析: 分析网站流量的来源:广告推广、自然搜索、付费搜索、直接流量

网站流量多维度细分: 通过不同维度对指标进行分割,访问来源(时间粒度和地理位置) 访问媒介(目标页面和新老访客)

网站内容及导航页分析 页面可以分为导航页、功能页、内容页

网站流量转化漏斗分析 首页

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值