数据分析我可以_29.以下哪个选项是数据分析标准流程?a 明确目标一明确分析维度和指标一数据采-CSDN博客

本文链接：https://blog.csdn.net/qq_37985803/article/details/110882360

本文详细介绍了数据分析的流程，包括数据采集、指标建模、数据分析等步骤，并探讨了常用的用户、行为和业务数据指标，如DAU、MAU、留存率等。此外，文章还讲解了数据指标的认知，如活跃用户定义，以及如何选取和理解新增用户。同时，提到了数据分析套路和方法，如对比分析、多维度拆解，以及数据工具的选择。

摘要由CSDN通过智能技术生成

一、数据分析流程

大概流程是这样的，数据采集-指标建模-观测数据-数据分析-驱动业务

数据采集，做一次比较靠谱的数据分析自然要有数据的支持。那么在数据的采集上，我们需要注意的是数据必须和业务有关，数据的采集被数据指标所驱动。
指标建模，指标建模是数据分析中的重中之重，直接决定了你这次分析的成败。因为所有的决策最后都是根据这些指标得出来的。
观测数据，指标建立完毕，那么需要对采集到的数据进行观察，看哪些数据通过计算清洗可以得出我们想要的数据。
数据分析，包含数据清洗、数据可视化、数据报表等工作
驱动业务，数据分析师存在的意义就是为公司解决问题，让数据产生价值，所以最后的决策一定是能驱动公司业务发展，指出方向的。

二、常用的数据指标

1.用户数据

存量：DAU&MAU
增量：新增用户
健康程度：留存率
从哪儿来：渠道来源

2.行为数据

次数/频率：PV、UV、访问深度
路径走通程度：转换率
做了多久：时长
质量：弹出率

3.业务数据

总量：GMV 、访问时长
人均：ARPU、ARPPU、人均访问时长
人数：付费人数、播放人数
健康程度：付费率、付费频次、观看率
被消费对象：SKU视角、被消费内容视角

三、指标定义认知

3.1DAU&MAU

日活跃用户和月活跃用户，日活跃用户即每日上线用户数量，月活跃用户<=最大日活+新增用户<=总用户量。月活跃用户数即当月至少活跃一次的用户总数，也就是需要去重，这样的数据才是有意义的。

怎么定义活跃用户？

基于事件上报：这个用户主动产生了一个行为，被数据系统统计下来，则是一个活跃用户。这种方式记录活跃用户，需要确保用户主动上报事件，而不是系统后台自动上报事件。
关键事件：用户执行了关键事件，则是一个活跃用户。这种方式判断，需要建立一个关键事件的列表，由于这个列表一定是一直不断更新迭代的，所以维护成本比较高，而且也存在一定的沟通成本。

怎么定义用户？

产品与用户之间隔了一层设备，一个人拥有的可能不止一台设备，我们需要通过哪些维度去判定这就是我一个用户呢？

基于用户ID：这种做法是比较常见的，通过去识别每位用户的唯一ID，判断是否为用户。但这种方式就排除了未注册的用户，存在一定的局限性。
基于设备：像web产品中，可以在浏览器的cookie里添加标识，以此判断用户。但是也存在局限，如果设备主人的朋友或亲人使用这台设备使用产品，则系统认定的用户还是设备主人，但其实已经换人了。

3.2如何理解新增用户

选择合适的节点，定义“增”

节点选择
	点击渠道链接	下载	安装/启动	激活/注册
优势	统计渠道商简单	真正反映了用户的实际意愿	便于产品方统计	最真实有效的数据
劣势	离激活环节最远，转化率太差，无法保证	数据源可信度存疑，无法避免刷量	渠道不一定配合，仍然无法避免刷量	渠道费用激增，统计复杂
适用场景	量级不大/免费渠道，不需要做精细打算	渠道依赖应用商店，且没有更好的渠道	己方比较强势，可给渠道制订计划规则	对用户质量要求很高，产品的ARPU高

用适当的方法判别新

基于设备：Mac、Android、web各有方法判别

基于账号关联：与后台账号进行比对

3.3理解留存

为什么要看留存？

了解一个渠道的质量--日留存，以日为单位，衡量这个渠道来的用户当下&接下来的表现。
观察整个大盘--周留存/月留存

3.4PV、UV、访问深度

PV：Page Views页面浏览量（次数，不去重）

UV：Unique Visitors 独立访问数（人数，去重）

PV/UV：人均行为次数

访问深度：可以用关键某些关键行为的访问次数或将产品功能分为几个层级，以用户访问到的层级做计算

3.5访问时长

为何统计访问时长？

通过统计特殊事件，支持业务需求
侧面反应产品质量

3.6弹出率

定义：是指一个用户来了之后，立马就走了的比率。

3.7常用的业务数据指标

常用业务数据指标
直接付费	适用场景	解决什么问题	非直接付费
GMV	总量	描述交易的金额总规模	目标完成数（报名、点击、分享……）
ARPU/ARPPU	人均	单个用户的贡献程度	人均访问时长
付费人数	人数	描述愿意为服务付费的人数总规模	完成人数
付费率、付费频次	健康程度	描述总体上的用户付费意愿评判一个服务的健康程度	完成率
SKU视角	被消费对象	需要分析消费品本身的运营情况时	被消费内容视角

四、选好数据指标的通用方法论

1.从业务的最终目的出发，梳理业务模块

常见的拆解角度：如何搞大/搞频繁 | 有困难靠什么特色方式解决（工具）

2.判断业务模块所属类型

四类业务模块
	产品对用户的价值来自产品本身	产品对用户的价值来自其他资源
省时间	工具模块	交易模块
杀时间	内容浏览模块	社区模块

3.根据业务模块所属类型选择数据指标

工具类模块关心的指标
通用指标	描述了什么	举例	做好了就能怎样
使用量	累积量、投入程度	拍照、笔记	用户黏性强
目标达成率	是否正常运转	支付、搜索	满意度高
频次	能不能让用户养成习惯	闹钟	养成固定习惯

交易类模块关心的指标
通用指标	描述了什么	举例	做好了能怎么样
详情页转化率	核心场景转化效率	电商	更容易卖
金额	总的交易规模	电商、知识付费	卖更多
客单价	单个用户价值	奢侈品海淘	卖更高价
复购率	收入的持久度	订阅式购物	卖更多次

内容浏览类模块关心的指标
通用指标	描述了什么	举例	做好了能怎样
浏览数	累积量	头条类	有多少人阅读
浏览广度	覆盖内容库存情况	视频网站多个频道	库存利用率更高
浏览时长	占据用户多少时间	抖音、快手	减少竞品使用时间
内容互动	用户对内容的情感	A站、B站	用户黏性

社交类模块关心的指标
通用指标	描述了什么	举例	做好了能怎么样
发布量	用户创作内容的数量	贴吧、FB	更多的话题源头
互动量	用户间的互动次数	微博	社区更具有活力
关系密度	用户间的关系	微信	更有可能长期留存

五、数据工具

如何选取数据工具？

根据业务核心划分
根据公司阶段划分

	探索期	成长期	成熟期	衰退期
业务问题	刚起步不完善，流程未定型，常变动	追求增长、同时补偿前期债务	稳定，没有新的突破点	用户对产品渐渐失去兴趣，开始流失
待解决需求	验证业务是否可行、需求是否可行	寻找用户量和业务量规模化增长的方法	业务流程理的更顺、用户群体拆得更细	延长产品生命周期、尽力挖掘用户剩余价值及可能的新需求
所需的数据工具	计数	流量导向内容导向用户导向业务导向	用户导向业务导向	用户导向

探索期

成长期

成熟期

衰退期

业务问题

刚起步不完善，流程未定型，常变动

追求增长、同时补偿前期债务

稳定，没有新的突破点

用户对产品渐渐失去兴趣，开始流失

待解决需求

验证业务是否可行、需求是否可行

寻找用户量和业务量规模化增长的方法

业务流程理的更顺、用户群体拆得更细

延长产品生命周期、尽力挖掘用户剩余价值及可能的新需求

所需的数据工具

计数

流量导向

内容导向

用户导向

业务导向

用户导向

业务导向

用户导向

六、常见的数据分析套路

1.计数

解决的问题：计数、特别基本的分析功能

优势：快，逻辑简单

2.流量导向

谁来了-从哪来-来了干什么-有没有达成目标

解决的问题：流量依赖性业务，如电商或一锤子买卖

优势：将流量入口分析的较为细致

3.内容导向

哪些资源被消费
被消费的情况如何
内容表现质量如何

解决的问题：以内容为核心资源的，如媒体、视频网站

优势：能从内容的视角描述其表现

4.用户导向

用户来了干什么？
用户还会不会再来？
用户在哪流失？
用户都是啥样的？

解决的问题：需要关注隐藏在报表、总量下面的，用户具体的行为

优势：从用户视角描述单个用户的行为轨迹

5.业务导向

解决问题：

流程是否顺畅？
规模/频次如何？
异常原因何在？

分析套路表
	计数	流量	内容	用户	业务
关键	快速验证	渠道依赖	内容质量	用户为王	商业本质
特点	简单、快	能将流量入口分析得较为细致	能从内容的视角描述其表现	从用户视角描述单个用户的行为轨迹	从商业逻辑上还原整个业务流程，可接入线上线下数据
常见应用场景	单纯计数和固定报表	流量依赖性业务，如电商、或者一锤子买卖	以内容为核心资源的，如媒体、视频网站	在乎用户长期价值，企业核心资产是用户	业务逻辑复杂，需要跟踪周期长

七、常见的数据分析方法

7.1对比分析

怎么比：按维度进行划分对比，如时间、类别，同比、环比

比什么：本身具备价值的数字（如：销售金额、阅读数）、在具体环境中看比例才具备对比的价值（活跃占比、付费占比、注册转化率）

和谁比：本身、竞品对象、竞争行业

7.2多维度拆解

定义：用不同的视角去拆分、观察同一个数据指标

适用场景

分析单一指标的构成	针对流程进行拆解分析	还原行为发生时的场景
分栏目的播放量	不同渠道的浏览、购买转化率	打赏主播的等级、性别、频道
新老用户比例	不同省份的活动参与漏斗	是否在WIFI或4G化境下

运作原理：指标/业务流程需要按照多维度拆分，来观察变动