数据统计分析调研结果

最近项目需要一个数据收集分析的功能,做了一些调研。

目前做网络统计的方式有两大类:

1. Page Tagging, 即页面埋点;web端用js,移动端使用共用api。

2. Log file Analysis, 即log过滤分析;

两者对比如下:


web端目前主流Page Tagging框架有如下:

1. Google Analytics

基本流程:


优点:做的最好最全的,内容很强大,并且提供了很多的定制化报告。

缺点:由于我天朝的原因,GA访问不稳定。而且有延时。

2. 百度统计、腾讯TA、量子恒道、CNZZ等

全部是仿照GA。不过量子恒道后台因为使用了storm,所以可以提供实时报告,似乎是收费的。

3. 开源框架

找了半天,只有PiwikOpen Web Analytics。两个均是Php+Mysql实现。不符合我们分布式的“高大尚”……被放弃了。

不过个人感觉还是不错的,尤其他们也提供Logfile过滤处理功能。


Log File Analysis的框架数量倒是很多,但主流并不多见,因为限制很多。

1. Twitter Rainbird 

N年前就号称要开源,因为使用了beta版本的内部Cassandra未能开源,至今未见!

2. Logstash elasticsearch + Kibana 套件

新时代的“三件套”,值得一提的是三个任意都可以单独使用。Kibana的界面很赞。logstash支持很多服务器的log分析。

3. flume + 后端分析

flume等同于logstash,两者有很多相似之处。后端分析之所有没有写出来是什么,因为有太多种搭配,例如flume +kafka + storm, 甚至flume+elasticsearch+kibana都OK的。


PS:

在搜索这个资料时发现一个好东西——分布式追踪系统。国内知名的如阿里的“鹰眼”,国外twitter的Zipkin。后者已经开源(猛击这里),前者问了下阿里的哥们,明确说不会开源……囧  他们都是基于Google的Dapper论文(又见Google论文!),github上有一个原文+翻译的,share出来,猛击这里。有时间去研究一下。


移动端的数据统计分析的现况,结果令人惊讶:

1. 国外flurry 一统天下

2. 国内友盟被阿里收购,TalkingData目前市场占有率第一。其他半死不活。





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值