从零开始构建数据分析 唐裕凤
数据分析有什么用
大数据很火,很多公司都在采集数据,但是有什么用,很多公司不知道
明确产品现状:健康与否,增长空间,前景,和竞品的比较
运营监控:再不同的周期,情况如活动节日下,做的活动是否成功
KPI量化,KPI预设:KPI的定义一定是要用数据;开发团队的优化也需要数据分析,来制定计划。通过已有的数据,预估日活等
支持业务决策:明确一个商业模式,公司战略
数据产品:淘宝指数,百度指数等
数据建模体系:
如何采集数据
1采集什么数据
APP常见采集数据:
app启动:启动时间,启动时长
页面展示/点击事件:如果某个页面没被点击过,那要分析是没用的页面还是太深点不到。
关键行为:ER图:app核心功能,app能做什么,一般采集详细全面,深度分析
错误信息:问题,bug
通常数据人员要输出埋点文档,与产品和开发沟通,加深产品理解,做好数据规划。漏埋点就会少数据
2怎么采集数据
数据源:
SDK公司统一的数据采集接口,所以有规范
JS和SDK差不多
服务器日志:非结构化要处理
数据库:结构化数据
数据收集服务器:转化数据到需要的格式
注意事项:
正确性
有效性
及时性:实时计算数据+离线计算数据
采集数据——解决方法
有数据测试人员根据数据测试工具保证
如何构建数据指标体系
构建数据指标体系思路哪里来
很多数据分析公司比如
友盟移动产品DEMO
7大数据指标构建数据指标体系
关键指标:日活、累积、新增、收入
渠道分析:不同渠道的效果
版本分析:新功能效果等,新用户留存
用户分析:用户活跃度,自然属性分析如性别低于
终端属性:手机型号,分辨率,网络
关键行为:核心指标
自助查询:帮助其他人员更好的食用数据
关键指标
反应产品基本概况
指标维度不能过多:
维度一般只有一个日期
指标一般超过5个,常见有日活,新增,累积,关键行为指标
渠道分许
渠道质量:新增、活跃、留存等指标
防作弊:用户使用时间、用户属性、关键行为占比
版本分析
新版本的新功能体现
新版本的已有业务的影响,与旧版对比
从灰度版就要跟踪,直到正式版
用户分析——新用户留存模型
1、N日留存定义:新增用户再N日后活跃,常有1日,7日,30日留存
2、计算方法:取决于用户库模型
3、421原则:参考标准
一款app产品,当次日留存到40%,7日留存到20%,30日留存到10%,即可认为产品较叫康
当然,留存率取决于产品的功能,不同类型产品器标准不同
租房的产品和外卖肯定标准不容啊
租房一年也就以此
关键行为:
1产品的核心功能,并数据化体现——你为了这个核心功能埋了多少的点
2核心功能的子功能,并数据化体现
3关键行为一般非常细致,甚至看数据清单
终端属性:
*用户画像:个性化运营
设备终端
网络及运营商
地域分布
自助查询
提供各业务组:产品、开发、运营、设计去提取需要的数据。
减少时间浪费
数据体系的应用
关于数据可视化,我们将学习一下内容
图表类型
图表案例
制图工具
条形图:对比,排序
趋势图:看出不同周期内用户趋势,递增递减斜率,做基础预测
散点图:做回归分析,研究两个变量之间的关系
饼图:穷尽的,加在一起100%;分类不要大于5个,顺时针递减
图形组合
等等图
**作图工具
付费的 think-cell 嵌入再PPT中
免费 网页访问百度的Echarts
网易数读 看数据图表,每张图都是新闻的形式**
常用数据分析理论模型
案例:互联网
互联网的4P
导入期关注新增
成长期关注活跃
成熟期
衰退期关注流程
转化漏斗模型
获取用户——》活跃用户——》留存用户——》变现——》传播
*金字塔原理:指导你写分析报告的重要原理
案例:1345成本
金字塔结构的严谨性
每一层次的论点都是下一层次论点的概括
次一层次的论点确实支撑上一个层次的论点。没有废话
金字塔原理的具体做法:
自上而下法
提出主题思想
将主体思想进行分解
检查分解后的逻辑严谨性MECE
进一步分解并检查逻辑严谨性
自下而上发:
列出可能想到的所有要点
找出关系进行归纳
得出结论
检查逻辑严谨性
横向:
演绎推理——演绎顺序:
问题-原因-解决方案
大前提-小前提-结论
归纳组合:
时间顺序:先后顺序,前因后果
空间顺序:个体整体,全局细节
重要性顺序:按重要性分组