概述
统计指标、业务数据、预制模型、自定义分析
数据采集-指标建模-观测数据-数据分析-业务洞察
数据使用的能力模型
能力项 | 本课程 | 未来 |
建模 | 目标明确、流程单一的功能/模块 | 复杂产品的指标体系 |
工具 | 利用现有工具自身的特性 | 跨工具组合使用 |
方法 | 掌握9个常见分析方法 | 需求驱动的分析方法 |
应用 | 完成对业务现状的描述 | 用数据为业务直接产生价值/预测趋势及未来 |
一、指标建模
1、数据指标
什么是数据指标?-对当前业务有参考价值的统计数据
常用的数据指标有哪些?它们是怎么定义的?
日常工作中查看这些指标会碰到哪些坑?
①用户数据:
存量-DAU/MAU
增量-新增用户
健康程度-留存率
从哪儿来-渠道来源
②行为数据:
次数/频率-PV、UV、访问深度
路径走通程度-转化率
做了多久-时长
质量-弹出率
③业务数据:
总量 | GMV | 访问时长 |
人均 | ARPU/ARPPU | 人均访问时长 |
人数 | 付费人数 | 播放人数 |
健康程度 | 付费率、付费频次 | 观看率 |
被消费对象 | SKU视角 | 被消费内容视角 |
1)用户相关指标:
Daily/Monthly Active User
日/月 活跃 用户
Daily 自然日 若跨时区则关心最近24H
Monthly 当月至少活跃一次的用户总数
MAU不等于当月各日DAU之和
单纯将日活累加而不去重,是没有任何参考价值的
Active
方法一:数据统计系统的定义
预制报表的统计系统(友盟、百度统计、GA等等)
基于事件上报:有事件上报=该用户活跃
上报一事可能有“坑”(假定了事件上报一定来自用户主动操作)
谨防Surprise!(活跃暴增,其他数值并无显著增加)
方法二:业务上的定义
基于关键事件上报:用户执行了关键事件=该用户活跃
存在维护成本:需不断维护日活时间列表
存在沟通成本:团队内外对(活跃)的认识需统一
User
认人
给每位注册用户一个唯一的专属ID
只适合强注册/登陆环境,未登录的用户会被漏掉
用户数=访问过服务的ID数
认设备
在网页cookie中埋下一段长随机字符串,作为设备唯一标识符
无法对应设备背后的用户
用户数=访问过服务的设备数
认人OR认设备
是否有账号体系?no=认设备
业务场景是否强依赖登陆?yes=认人+认设备
不登录的用户对业务是否有价值?no=认人+认设备 yes=认设备
新增用户
问题一:选择合适的节点,定义(增)
渠道商往往强势,哪个节点算钱应该先谈清楚
渠道ABC-渠道页面-应用商店-应用首页-完成注册
点击渠道连接 | 下载 | 安装/启动 | 激活 | |
优势 | 统计简单 | 真正反映了用户的实际意愿 | 离(激活)最近,便于统计 | 最(真实)的数据 |
劣势 | 离激活环节最远,转化率太差 | 数据源可信度存疑,无法避免刷量 | 渠道不一定配合,仍然无法避免刷量 | 渠道费用激增,统计复杂 |
适用场景 | 量级不大/免费渠道,不需要做精细结算 | 渠道依赖应用商店且没有更好的渠道 | 自己较强势,可给渠道制定统计规则 | 对用户质量要求很高且产品ARPU高 |
问题二:用适当的方法,判别(新)
基于设备
基于账号关联
用户留存
为什么要看留存?
了解某一个渠道的质量-日留存(7日日留存/30日日留存)
以天为单位,衡量这个渠道来的用户当下&接下来的表现
以(x日日留存)作为比较标准时,可以避免其他日数据的干扰
特殊:用户访问特别集中,只看Day7来评价,往往不能反映真实情况,此时,关注7日内活跃情况,更能描述渠道质量
观察整个大盘-周留存/月留存(次周周留存/次月月留存)
以周/月为单位,衡量产品的健康情况,观察用户在平台上的粘性
务必去重!
2)行为相关数据指标&#x