数据埋点是什么?设置埋点的意义是什么?

作者:大头鱼
链接:https://zhuanlan.zhihu.com/p/25195217
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

所谓埋点就是在应用中特定的流程收集一些信息,用来跟踪应用使用的状况,后续用来进一步优化产品或是提供运营的数据支撑,包括访问数(Visits),访客数(Visitor),停留时长(Time On Site),页面浏览数(Page Views)和跳出率(Bounce Rate)。

这样的信息收集可以大致分为两种:页面统计(track this virtual page view),统计操作行为(track this button by an event)。

1. 数据埋点的方式

现在埋点的主流有两种方式:

第一种:自己公司研发在产品中注入代码统计,并搭建起相应的后台查询。

第二种:第三方统计工具,如友盟、神策、Talkingdata、GrowingIO等。

如果是产品早期,通常会使用第二种方式来采集数据,并直接使用第三方分析工具进行基本的分析。而对于那些对数据安全比较重视,业务又相对复杂的公司则通常是使用第一种方式采集数据,并搭建相应的数据产品实现其数据应用或是分析的诉求。

2. 关键指标

我们先看看无论是APP,H5还是小程序都会关注的指标,了解这些指标的计算方法的细微差异以及复杂性,换个角度来思考埋点的意义。【源自:精通Web Analytics 2.0】

访问与访客

访问次数(Visits)与访问人数(Vistors)是几乎所有应用都需要统计的指标,这也是最基础的指标。

对于应用的统计来说,经常看到的DAU,MAU,UV等指标都是指统计访客(Vistors)。访问(Visits)是指会话层,用户打开应用花一段时间浏览又离开,从指标定义(访问次数)来说这被称之为统计会话(Session)数。

一次会话(Session 或 Visit)是打开应用的第一个请求(打开应用)和最后一个请求决定的。如果用户打开应用然后放下手机或是离开电脑,并在接下来30分钟内没有任何动作,此次会话自动结束,通常也算作一次访问或会话期(30分钟是早起网页版应用约定俗成的会话数定义,目前用户停留在应用的时长变长,30分钟的限定也可能随之不同,总之是能代表一次用户访问的时长)。

在计算访问人数(Vistors)时,埋点上报的数据是尽可能接近真实访客的人数。对于有需要统计独立访客这个指标的场景,这里还是需要强调一下,访问人数(Vistors)并不是真实独立的人,因此收集数据时必须知道访问人数虽然能够很好的反映使用应用的真实访问者的数量,但不等于使用应用的真实人数。(原因是,重复安装的应用,或是手机参数被修改都会使得独立访客的指标收到影响。计算访问人数的埋点都是依赖Cookie,用户打开应用,应用都会在此人的终端创建一个独立Cookie, Cookie会被保留,但还是难免会被用户手动清理或是Cookie被禁用导致同一用户使用应用Cookie不一致,所以独立访客只能高度接近于使用应用的真实人数。)

停留时长

停留时长用来衡量用户在应用的某一个页面或是一次访问(会话)所停留的时间。

页面停留时长,表示在每个页面所花费的时间;例如:首页就是进入首页(10:00)到离开首页进入下一个页面(10:01)的时长,首页停留时长计算为1分钟。页面A是2分钟。停留时长的数据并不都是一定采集得到的,比如页面B进入时间(10:03),离开出现异常或是退出时间没有记录,这时候计算就是0 (所以指标计算时需要了解埋点的状况,剔除这样的无效数据)。

应用的停留时长,表示一次访问(会话)所停留的时间,计算起来就是所有页面的访问时长,同样是上一个流程,应用的停留时长就是4分钟。

跳出率

跳出率的计算方法现在在各个公司还是很多种,最经常被使用的是:用户只访问了一个页面所占的会话比例(原因是:假设这种场景,用户来了访问了一个页面就离开了,想想用户使用的心里画面应该是:打开应用,心想什么鬼,然后关闭应用甚至卸载了。这个场景多可怕,这也是为什么跳出率指标被如此关注)

跳出率可以分解到两个层次:一是整个应用的跳出率,二是重点的着陆页的跳出率,甚至是搜索关键词的跳出率。跳出率的指标可操作性非常强,通过统计跳出率可以直接发现页面的问题发现关键词的问题。

退出率

退出率是针对页面的,这个指标的目标很简单,就是在针对某个页面有多少用户离开了应用,主要用户反映用户从应用离开的情况。哪些页面需要被改进最快的方式被发掘。(注意:退出率高不一定是坏事。例如:预测流程的最终节点的退出率就应该是高的)

转化率

我们在产品上投入这么多,不就是为了衡量产出么?所以对于电商类应用,还有比转化率更值得关注的指标吗?转化率的计算方法是某种产出除以独立访客或是访问量,对于电商产品来说,就是提交订单用户数除以独立访客。

转化率的计算看起来想到那简单,但却是埋点中最贴近业务的数据收集。这也是最体现埋点技巧的指标,需要结合业务特点制定计算方法。提交订单量/访客数是最基本的转化率,转化率还可以分层次,指定用户路径的,如:完成某条路径的提交订单数/访客数。

试着找一条路径,想想转化率的数据怎么得来的吧,埋点都收集了什么样的数据吧?

参与度

参与度并不是一个指标,而是一系列的指标的统称,例如访问深度,访问频次,针对电商的下单次数,针对内容服务商的播放次数,及用户行为序列这些都可以是衡量参与度的指标。之所以把参与度列为一个指标,是希望大家明白把指标结合业务,产生化学反应,活学活用去发现事物的本质。

3. 埋点的内容

看完关键的这些指标后,其实埋点大致分为两部分,一部分是统计应用页面访问情况,即页面统计,随页面访问动作发生时进行上报;另外一部分是统计应用内的操作行为,在页面中操作时进行上报(例如:组件曝光时,组件点击时,上滑,下滑时)。

为了统计到所需要的指标,应用中的所有页面,事件都被唯一标记,用户的信息,设备的信息,时间参数以及符合业务需要的参数具体内容被附加上报,就是埋点。

4. 关于埋点的数据的注意事项

不要过分追求完美

关于埋点数据有一点至关重要,埋点是为了更好地使用数据,不要试图得到精准的数据要得到的是高质量的埋点数据,前面讨论跳出率就是这个例子,得到能得到的数据,用不完美的数据来达成下一步的行动,追求的是高质量而不是精确。这是很多数据产品容易入坑的地,要经常提醒自己。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
如何设计埋点⽅案 如何设计埋点⽅案 ⼀ ⼀.与埋点相关的⼀些概念: 与埋点相关的⼀些概念: (⼀).埋点⽅式   1.代码埋点     代码埋点是最经典埋点⽅式,实施埋点的研发将埋点代码结合到业务代码中,实现⽤户⾏为数据的采集。这种埋点⽅式能采集到⾮常复杂的⾏为,尤其是⼀些⾮点击 的、不可视的⾏为,必须⽤代码埋点来实现。代码埋点按照位置的不同,可以分为前端埋点、后端埋点。前端埋点⽤来记录⽤户在客户端的操作⾏为,后端埋点⽤来记录客户 端进⾏服务器请求的⽇志。     代码埋点分为以下两种⽅式:     (1)前端埋点       前端埋点能够收集更全⾯、精细的⽤户数据,尤其是不需要请求服务器的⾏为数据,如:页⾯停留时长、页⾯浏览深度、视频播放时长、⽤户⿏标轨迹、表单项 停留及终⽌等等,只能通过前端埋点实现。但缺点在于,前端埋点的上报⼀般存在 15% 左右的延迟上报和漏报(客户端未联⽹、数据打包上报、⽤户删除⾏为数据等原 因)。另外,如果客户端是 APP,每次上线新的埋点或者更新埋点时,需要发布新的版本才⾏,但是会存在部分⽤户不更新版本情况,影响数据质量。     (2)后端埋点       理论上,只要客户端向服务器发送过请求,服务端埋点能够收集到。相⽐于前端埋点,能实时采集数据,不存在延时上报,数据很准确;并且,服务端埋点⽀持 与⽤户⾝份信息和⾏为附带属性信息整合;另外,每次上线新的埋点或者更新埋点时,发布后马上⽣效。     代码埋点适合精细化分析的场景,我们可以将各种细粒度的数据采集下来,后续做深度分析。当然这种埋点⽅式很低效,需要经历完整的埋点流程,包括业务梳理 (产品运营)、埋点设计(产品运营/研发)、实施/测试/上线埋点(研发/测试)。整个过程需要多⽅协作,且要求产品运营也具备⼀定的专业⽔平,如果发⽣错漏⽆法快速补 救。   2.全埋点     ⽆埋点、⽆痕埋点、⾃动埋点,指的都是全埋点。这种埋点⽅式想要实现的效果是全⾃动化埋点,将客户端的⽤户⾏为尽可能地全⾯采集,然后通过界⾯配置的⽅式 对关键⾏为进⾏定义。使⽤这种⽅案,每次有⽤户⾏为分析的需求,不⽤再⾛⼀次完整的埋点流程,只⽤在产品中嵌⼊ SDK,等于做了⼀个统⼀的埋点。但是,⽆埋点也有 很明显的弊端。⽆埋点只能覆盖基本的点击、展⽰等⽤户⾏为;其次,全埋点采集的数据量⾮常⼤,随着数据量上升,可能会导致客户端崩溃的概率也会上升。尤其是移动 端,更多的数据量意味着更多的电量、流量和内存消耗;第三,即使全部⾏为数据都被收集回来了,具体分析时也不能避免⼆次梳理和加⼯,因为机器⽆法在采集时按照我们 想要的⽅式对全部事件进⾏有意义的命名,甚⾄⽆法保证采集上来的事件都正好是正确的;第四,现阶段全埋点对于⽤户⾝份信息和⾏为附带的属性信息也⼏乎⽆能为⼒。   3.可视化埋点     可视化埋点也被称为「⽆码埋点」,它的理念是降低实施埋点的门槛,以此来提升原⼯作流程的效率。实施埋点时,⽆需研发⼈员介⼊,产品运营可以直接在⽹站或 移动应⽤的真实界⾯上操作埋点,⽽且埋点之后⽴即可以验证埋点是否正确,并且,埋点部署到所有客户端也是⼏乎实时⽣效的。同样的,可视化埋点也有很多局限。⾸先, 可视化埋点也只是针对点击可见元素的,⼀些动态页⾯、不可见的⾏为是采集不到的;其次,对于点击操作附带的业务属性,⽐较难实现;第三,为了确保埋点准确性,可视 化埋点也逐步整合了更为复杂的⾼级设置,操作起来也很低效。 (⼆).埋点⽅案相关概念   1.事件     记录⽤户在使⽤⽹站、APP 或⼩程序的过程中触发的⾏为。     ⽤户的⾏为有⼀部分会在他们使⽤的过程中⾃动被采集上来,常见的如:跟访问有关的"页⾯浏览","停留时长";另外⼀部分包含具体业务含义的,则需要通过埋点才 能得到,例如:"注册"、"登录"、"⽀付"等等。   2.事件属性     可以通过属性为事件补充相关的信息,例如:位置,⽅式和内容。     ⽤户产⽣⾏为时就会上报具体的属性值,⽐如对"购买事件"定义了"⽀付⽅式"的属性值,则根据不同的⾏为可能上报的是微信⽀付,⽀付宝⽀付。事件属性有点像字 段,发⽣这件事件的⼀些相关字段都可以理解为属性,例如"购买事件"中的⽀付平台、⾦额、银⾏卡等相关字段,都可以被定义为事件属性。   3.⽤户属性     在分析过程中,需要引⼊注册⽤户的更多维度,⽐如注册⽤户ID、姓名、⽤户等级等等,也需要进⾏梳理,⽅法同事件属性。    ⼆ ⼆.埋点⽅案,以京东排⾏榜为例 埋点⽅案,以京东排⾏榜为例    1.⾸先分析分析当前APP所处的阶段,设置合理的⽬标。 京东排⾏榜是为了让⽤户跟着排⾏榜购买好物,即为了让⽤户更多地消费,同时由于推荐的是经得起考验的好物,也希望能在客户⼼⽬中留下好的⼝碑,提⾼⽤户对APP购物 体

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值