HTTP访问日志记录和分析

公司自研的嵌入式浏览器发布运行已经有一段时间了,一直没有做详细的数据统计,这次提出需求,需要较详细的统计数据。

浏览器是通过代理服务器访问网页内容,在代理服务器上做了一次协议转换,将html页面转换为私有的二进制协议返回浏览器端,以节省流量和加快浏览速度。所以要增加统计数据只需要在代理服务器端进行处理。

需要考虑的是如何记录用户访问数据,公司现已有一套数据仓库和数据分析系统,也有专门的人员做数据分析。所以最早考虑的方案是直接将用户的HTTP访问记录写入数据库,然后由数据仓库的分析人员定时导入到数据仓库进行数据分析。但是考虑到目前数据仓库处理和分析数据需要的时间较长,统计数据的即时性有一定欠缺。

最终决定采用记录到日志文件的方式,采用apache的http日志格式:
"%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\""
因为会访问大量不同站点,所以在最前面增加了Host项,如下:
"%host %h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\""

然后直接采用Awstats进行日志分析。

因为代理服务部署了多个节点,并分布在不同的IDC,所以还面临着日志如何合并处理的问题,目前只针对单个服务器上的日志做了合并,不同服务器的数据还无法合并。
但是http日志可以很容易的导入到数据仓库中,因此总的日志的统计分析可以考虑在后期使用数据仓库进行。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值