数据指标体系

数据规划

数据采集

1、用户的那些数据会被采集,是客户端采集、还是服务器端采集。

数据埋点采集到的信息:

  1. 设备的硬件信息:设备的品牌、型号、主板、CPU、屏幕分辨率。
  2. 软件能力:横竖屏、截屏、摇一摇等操作。
  3. 数据权限:相册、通讯录、GPS
  4. 用户的行为:对APP操作的记录

2、实现数据采集的技术有哪些、有什么异同。

数据埋点

  • 前端埋点

前端埋点通过SDK进行数据采集,为了减少移动端的数据流量,通 常对采集的数据进行压缩、暂存、打包上报。对于那些不需要实时上报 的事件,通常只在Wi-Fi环境下上报,因此会出现数据上报的延迟与漏 报现象。

  • 后端埋点

后端埋点通过调用API(Application Programming Interface)采集信 息,使用内网传输信息,基本不会因为网络原因丢失数据,所以后端传 输的数据可以非常真实地反映用户行为。

每种埋点方式的优缺点

3、采集到的数据是怎么实现上报的。

  • 客户端上报

客户端上报数据流程如图4-4所示,用户在客户端进行操作时,客 户端通过网络发送HTTP(Hypertext Transfer Protocol)请求给服务端, 同时将数据上报给服务端(服务器)。

  • 服务端获取

在网页中,用户首次看到的内容,都是从服务器返回的。那么服务 器在应答客户端请求的时候,也能获取一些基本信息,比如浏览器类 型、版本号、屏幕分辨率、IP地址等。

4、数据埋点方案的设计

4.1. 确认事件与变量 这里的事件是指产品中的功能或者用户的操作,变量是指描述事件 的属性或者关键指标。

AARRR(Acquisition Activation Retention Revenue Referral)海盗模型或者UJM(User Journey Map,用户旅程图)模型进行逐步拆解,理清用户生命周期和行为路 径,抽象出每一个步骤的关键指标。

4.2. 明确事件的触发时机

不同的触发时机代表着不同的事件计算口径,因此触发时机是影响 数据准确性的重要因素。

4.3. 明确事件的上报机制

上报机制也是数据准确性的重要影响因素之一。客户端上报数据可 能会由于网络连接原因出现丢包的情况,前面章节已经详细介绍过上报 机制之间的异同,这里就不再赘述。数据分析师在完成埋点工作的时候 也需要确定数据是实时上报还是异步上报,以确定埋点是否合理,并及 时调整数据埋点方案。

4.4. 统一表结构

统一数据表结构,可方便团队内部进行数据的管理和数据复用,建 议在团队内部形成一套统一的数据结构规范。

4.5. 统一字段名规范

有了统一的数据表结构规范还不够,统一数据命名规范也是数据埋 点工作的重要一环。如果有条件的话,可以建立数据字典,以统一数据 命名规范。

4.6. 明确优先级

数据埋点是为数据应用做铺垫的。埋点之后,数据分析师可能面临 着搭建指标体系和数据报表体系的工作,可以根据报表的优先级、埋点 的技术、实现成本及资源的有限性,为数据埋点确定优先级。

5.以电商成交为例实现数据埋点设计

6.数据埋点文档

数据传输

数据存储

数据分析业务问题

构建数据标签体系

数据标签体系流程

标签的分类

1. 统计类标签

统计类标签是较为常见的数据标签。例如,对于某个用户来说,其 性别、地区、年龄、近7日活跃天数、近7日平均活跃时长等标签都可以 从用户注册表、登录表中统计得出[1]。

2. 规则类标签

规则类标签是数据分析师基于用户行为数据及运营人员的经验共同 制定的数据标签。数据分析师可以基于数据特征的分布及运营人员的意 见,定义统一的计算口径,实现用户数据标签化。例如,数据分析师根 据用户付费金额的数据分布,同时参考运营人员的经验值,将月累计付 费金额≥2000元的用户定义为高付费用户。

3. 模型类标签

对于用户流失场景、用户转化场景,统计类标签和规则类标签可能 满足不了业务需求,此时就需要基于用户历史行为数据通过机器学习的 方法预测用户流失或转化的倾向。模型类标签的开发通常由算法工程师 或者数据工程师开发,但是这类标签开发成本较高,时间周期较长,因 此其所占比例较小

如何构建数据标签体系

1. 明确业务需求

明确业务需求是开发数据标签的第一步。这一阶段需要数据分析师 与业务方沟通数据标签体系的运用场景,是运用于智能触达、用户分层 还是个性推荐或其他场景。如果有明确的使用场景,数据分析师还需要 沟通数据标签体系的开发周期等问题。因为数据标签体系的开发是一个 工作量大、周期长的工作。如果业务方需求较为紧急,可以考虑其他代 替方案。

2. 制定基础框架

数据分析师在明确具体的业务需求之后,可以着手制定数据标签体 系的基础框架。这个框架是数据标签体系开发的基础,框架层级可多可 少,但至少包括一级标签和二级标签。

3. 确定统一的计算口径

有了用户的数据标签体系框架之后,确定标签的统计维度及统计口 径是标签开发中较为重要的环节。因为对于同一标签来说,不同的统计 维度和统计口径往往会出现不同的结果。最好的解决办法是,数据部门 开发一份全公司统一的数据指标字典,各个指标以统计口径进行计算, 以防止统计口径不一致而造成的数据问题。

4. 数据标签开发

完成前期准备工作之后就到了标签开发阶段,这个阶段需要数据分 析师/数据工程师与算法工程师配合完成。数据分析师主要完成统计类 标签和规则类标签的开发,算法工程师主要完成模型类标签的开发,而 数据工程师会协助数据分析师完成标签的部署与调度。

5. 标签上线及维护

数据标签开发完之后,标签上线与迭代是后续的重点工作。数据部 门需要不断地调整/新增数据标签以满足不同的业务需求。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值