目录
- 前言
- 数据流向
- 数据埋点
- 数据接收
- 数据落地
- 数据展示
- 常用数据指标及分析方式
1、前言
本专栏前面的文章 “《爱创业APP》功能与原型图v1.0” 预告要出一期数据方面的文章,刚好肺炎期间赋闲在家专门总结一下。
2、数据流向
3、数据埋点
我们以前言提到的文章里面的埋点知识为例进行分析,可以分为以下几个用户行为事件进行埋点:
包括tab点击事件、搜索事件、bannner点击事件、快报点击事件、信息流阅读事件,每个用户行为都当做一条数据进行上报,收集到这些事件后,我们就可以分析每个用户都搜索了多少次,都进行了什么内容的搜索、banner各个内容被点击了多少次。
我们还可以对埋点做更系统性的规划:
通用事件:
适用于公司所有APP的通用用户行为事件,比如用户启动事件、页面进入事件、页面离开事件、分享事件等等。
自定义事件:
适用于单独某个APP或某个活动的事件,比如上面举例的用户搜索的事件、banner页点击的事件。
事件携带的通用信息:
每个事件都会携带的一些信息:比如这个用户行为事件发生的时间、发生时的session_id、当前设备号(IMEI、idfa)、系统(android、ios、web)、屏幕分辨率、语言、经纬度、运营商、手机品牌、渠道包信息、WiFi信息、设备信息(如电量)、设备唯一标识号、Mac地址等等。
事件携带的非通用信息:
每个事件可能都有会自己比较特别的信息,比如上面举例的搜索事件,那用户的搜索内容是其他事件所没有的,我们可以设置一个Map<String,String>的字段(可以理解为k,v结构的数组),统一塞入这些不通用的信息。
举个栗子,我们可以在各端埋点上获取以下数据:
4、数据接收
各端埋点的数据根据规范经上报后,数据接收层统一进行接收,根据接收到IP、经纬度等信息,可以获取国家、省、市,这些信息会进行注入,接收时间也会进行注入。
5、数据存储(计算)层
以上步骤得到的数据需要进行存储,一般通过hive建表存储在hdfs,通用名字叫数据仓库。
有一些数据的实时性要求比较高,比如每个小时的活跃的数,有了以上的数据就可以实时计算得到。
有一些数据实时性要求不高,但很重要,比如一整天的新增、活跃、留存,可以通过配置任务晚上时间进行计算,白天上班就可以知道前一天的数据概况。
6、数据展示层
很多公司都有数据展示平台,比如大盘数据,每天的新增、活跃、留存数据。
一些公司会开放自助SQL查询,对于项目上面提到的搜索事件可能不会放到大盘数据里展示,但是用户可以自己通过SQL查询。
还有一些公司会开放网页版即席查询系统,用户只要通过网页操作选择,程序自动拼接SQL,就会吐出数据,比如第三方的神策平台、cnzz等一些系统。
7、常用数据指标及分析方式
7.1常用的数据指标:
各APP总用户数、总设备数、总活跃数、总新增、用户平均使用时长。
各APP每时间段(天/周/月)在一些维度下(分/不分)渠道/版本/国家的新增/活跃/留存数据。
运营方、数据分析师、产品经理等关心的各个事件的数据、ab测试的数据、版本新发布新功能/老功能数据走向。
研发人员关心的如接口请求时长、请求成功数等数据。
一般公司还会有用户分群等各个维度的数据:
- 一线/二线/三线/四线/五线的用户集合;
- 东北/华北/华南/西南/西北的用户集合;
- 昨天新增用户/国庆活跃的用户/最近一周有进行消费的用户集合;
- 最近一周有进行购买记录且进行分享的用户。
我们可以根据这些用户维度对用户行为事件进行进一步细化统计分析。
7.2常用的数据分析方式
纯计量方式:在一定时间范围内,分组(分渠道、分国家、分是否新增等) 查看满足某些条件(where), 触发某个事件(如启动、搜索等)的总数、总设备数、人均次数、人均设备数、总账号数、ImeI数、idfa数。
漏斗查询:在一定时间范围内,分组(分渠道、分国家、分是否新增等) 查看满足某些条件(where)和窗口期(第一个事件和最后一个事件间隔最长时间)下,依次触发事件A、B、C...多个事件的漏斗数据,可以很方便的查看用户流失环节,便于改进产品。
留存查询:在一定时间范围内,分组(分渠道、分国家、分是否新增等) 查看满足某些条件(where), 先触发A事件,一定时间范围内触发B事件(默认与A相同),两者的数据比率,比如计算新增留存。
分布查询:在一定时间范围内,分组(分渠道、分国家、分是否新增等) 查看满足某些条件(where), 触发某个事件各个频次的用户数。比如每天触发启动APP 1次、2次、3次、4次..的总用户数。
路径查询:在一定时间范围内,分组(分渠道、分国家、分是否新增等) 查看满足某些条件(where),用户在访问A页面 紧接着访问B页面、C页面的总用户数,或者查询每个用户的页面路径数据。
还有很多查询范式。。。
7.3常用的数据展示图表
折线图
面积图
柱状图
饼图