Google Analytics(谷歌分析) 架构与原理

摘自: http://www.javabloger.com/article/google-analytics-architecture.html

 

Google Analytics(Google分析)是Google的一款免费的网站分析服务,Google  Analytics最早是由一些工程师设计的,后来被Google收购,现在被广受好评。对于Google Analytics的用户目前在国内的用户已经数以万计,本站 www.javabloger.com也使用Google Analytics工具对网站的访问趋势进行分析。Google Analytics功能非常强大,只要在网站的页面上加入一段代码,就可以提供的丰富详尽的图表式报告。

Google Analytics的采集功能是采用AJAX技术来实现,还可以对google共享你的分析数据,并且还可以设置系统提醒功能。
整体架构如图所示:

http://www.javabloger.com/images/article_pic/ga/google-analytics-architecture_s.png

 

 

 

 

使用Google Analytics我们知道首先需要在你的网站中加入根据代码,下面我们来看看嵌入在网站中跟踪代码如何工作的
谷歌分析跟踪代码(Google Analytics Tracking Code  GATC) 检索的网页数据如下:
   1    浏览器请求的网页包含跟踪代码。
   2    GATC创建并初始化一个对象的属性与网络相关的跟踪ID在代码中。
   3    GATC执行你自定义任何跟踪方法。
   4    跟踪代码初始化和管理以下信息:
          *跟踪检索查看是否包括广告系列。
          *收集从HTTP请求的信息到Google  GATC中介 的各种用户信息。
   5    将访问者HTTP请求包含GATC跟踪信息收集到参数名单。

 

以上详细过程还可以参考Google的官方资料http://www.google.com/support/googleanalytics/bin/answer.py?hl=cn&answer=55540
     和
Google分析工具的官方帮助中心:http://www.google.com/support/googleanalytics/

 

3.从Google 分析工具的报告版面上来看,GATC的数据收集的非常详细,能做到比较全面而不占用资源,对用户透明,不容易。

当你使用Google Analytics分析时需要你创建 Google Analytics的用户“网站配置文件” ,创建“网站配置文件”的目的是为了方便网站多个管理员从各种对网站不同的关注角度对网站的访问进行分析,每个用户之间的分析数据也是私密性的,尽管它可能需要几分钟额外设立一个新的帐户配置文件,它通常是值得的,因为它可以帮助访问安全性和数据完整性,确保能给你更准确和有用的信息。。

如图所示:
  http://www.javabloger.com/images/article_pic/ga/pf_user_ga.gif
当你在网站内创建完成“网站配置文件” ,接下来我们再来看看 访问用户、网站管理员、GA(Google Analytics) 大致是怎么样的工作过程。
   1.访问者访问网站
   2.触发到 GATC 代码,根据GATC采集用户信息,放入Google Analytics 日志
   3.通过你创建的过滤器对需要进行过滤的数据进行筛选。
   4.将采用和过滤后的信息放入Google Analytics 的数据库中
   5.管理者通过Google Analytics 的界面查看分析数据

 

整体工作流程如图所示:
http://www.javabloger.com/images/article_pic/ga/fl_user_ga.gif

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建 一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然 后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足 上述处理模型的例子,本论文将详细描述这个模型。 MapReduce架构的程序能够在大量的普通配置的计算机上实现并行化处理。这个系统在运行时只关 心:如何分割输入数据,在大量计算机组成的集群上的调度,集群中计算机的错误处理,管理集群中计 算机之间必要的通信。采用MapReduce架构可以使那些没有并行计算和分布式处理系统开发经验的程 序员有效利用分布式系统的丰富资源。 我们的MapReduce实现运行在规模可以灵活调整的由普通机器组成的集群上:一个典型 的MapReduce计算往往由几千台机器组成、处理以TB计算的数据。程序员发现这个系统非常好用:已 经实现了数以百计的MapReduce程序,在Google的集群上,每天都有1000多个MapReduce程序在执 行。 1、介绍 在过去的5年里,包括本文作者在内的Google的很多程序员,为了处理海量的原始数据,已经实现了数 以百计的、专用的计算方法。这些计算方法用来处理大量的原始数据,比如,文档抓取(类似网络爬虫 的程序)、Web请求日志等等;也为了计算处理各种类型的衍生数据,比如倒排索引、Web文档的图 结构的各种表示形势、每台主机上网络爬虫抓取的页面数量的汇总、每天被请求的最多的查询的集合等 等。大多数这样的数据处理运算在概念上很容易理解。然而由于输入的数据量巨大,因此要想在可接受 的时间内完成运算,只有将这些计算分布在成百上千的主机上。如何处理并行计算、如何分发数据、如 何处理错误?所有这些问题综合在一起,需要大量的代码处理,因此也使得原本简单的运算变得难以处 理。 为了解决上述复杂的问题,我们设计一个新的抽象模型,使用这个抽象模型,我们只要表述我们想要执 行的简单运算即可,而不必关心并行计算、容错、数据分布、负载均衡等复杂的细节,这些问题都被封 装在了一个库里面。设计这个抽象模型的灵感来自Lisp和许多其他函数式语言的Map和Reduce的原 语。我们意识到我们大多数的运算都包含这样的操作:在输入数据的“逻辑”记录上应用Map操作得出一 个中间key/value pair集合,然后在所有具有相同key值的value值上应用Reduce操作,从而达到合并中 间的数据,得到一个想要的结果的目的。使用MapReduce模型,再结合用户实现的Map和Reduce函 数,我们就可以非常容易的实现大规模并行化计算;通过MapReduce模型自带的“再次执行”(re- execution)功能,也提供了初级的容灾实现方案。 Google MapReduce中文版 编辑推荐 热点文章 ·理解REST软件架构 ·eBay的架构 ·如何成为一个好的系统分析员 ·什么是系统分析 ·怎样做一个优秀的系统分析师 ·优秀的系统分析师必读——需求分析20条原则 相关主题 最新文章 ·Google MapReduce中文版 ·Google的系统工程师(SA)如何工作 ·The Google File System中文版 ·无挑战,不工作之 -系统分析师招聘答案 ·五年Skype架构师之路的感言 ·深入分析IBM的云计算解决方案 PuzzleGames.alot.com Google 提供的广告 Google 提供的广告 Google Google推广 Google代理 C# Mapreduce Google优化 Google 提供的广告 Google AD Word Get on Google Google優化 Google广告 Download Google Analytics Gain traffic and optimize your site with Google Analytics. Free! www.google.com/analyticsGoogle MapReduce中文版-系统架构 http://www.kuqin.com/system-analysis/20100915/88059.html[2010-11-2 17:19:20] 这个工作(实现一个MapReduce框架模型)的主要贡献是通过简单的接口来实现自动的并行化和大规模 的分布式计算,通过使用MapReduce模型接口实现在大量普通的PC机上高性能计算。 第二部分描述基本的编程模型和一些使用案例。第三部分描述了一个经过裁剪的、适合我们的基于集群 的计算环境的MapReduce实现。第四部分描述我们认为在MapReduce编程模型中一些实用的技巧。第 五部分对于各种不同的任务,测量我们MapReduce实现的性能。第六部分揭示了在Google内部如何使 用MapReduce作为基础重写我们的索引系统产品,包括其它一些使用MapReduce的经验。第七部分讨 论相关的和未来的工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值