python数据分析-互联网业务数据分析流程及指标体系的搭建

本文详细介绍了互联网业务数据分析的流程,包括明确需求、数据清洗、指标选择等步骤。常见数据指标涵盖用户数据、行为数据和业务数据,如DAU/MAU、留存率、转化率等。同时,文章强调了选择合适数据指标的重要性,提出了通用方法论,并提供了如何评估用户活跃度、选择数据指标以及分析用户行为的实例。此外,文章还探讨了不同业务场景下的关键数据指标,如ARPU、ARPPU、ROI等,以及数据分析工具的选择与应用。
摘要由CSDN通过智能技术生成

一、 数据分析流程

1、明确需求
2、确定思路
3、处理数据
4、分析数据
5、展示数据,撰写报告
6、效果反馈

二、数据清洗

1、选择子集
2、列名重命名
3、删除重复值
4、缺失值处理
5、一致化处理(比如:统一单位,统一数据口径等)

缺失值的处理方案
1、如果数量比较少比较少,直接删除
2、如果是文本型,我们单独人为判断填写
3、填充缺失值,对于数值型,均值或者中位数,也可以使用一些插值方法填充

三、常见数据指标

业务指标:
衡量一个业务好坏或健康状态的标准。

指标分类:
1、用户数据:DAU/MAU、新增用户、留存率、渠道来源
2、行为数据:PV、UV、访问深度、转化率、时长、弹出率
3、业务数据:GMV、访问时长、ARPU/ARPPU人均访问时长、付费人数、访问人数、付费率、付费频次、留存率、SKU视角、被消费内容视角

如何选择指标首先要了解业务:
1、公司是做什么,卖什么产品,服务对象,有哪些业务
2、业务的好坏,了解相关核心指标
3、业务流程确定哪个环节出现问题

四、指标解释

基于用户

(1)活跃用户数
   互联网公司对活跃用户的定义大同小异,一般是指会访问app并带来价值的用户,以用户打开APP次记为一个活跃用户,活跃用户用于衡量app/web的运营现状。但是,单纯看活跃用户数很难界定它们好坏。好的数据指标,应该是比例或比率。

1、流失用户:有一段时间没有再打开产品,那么我们就视为流失用户、根据产品的属性.可以按30天、60 天、90天等划分
2、不活跃用户:有一段时间没有打开产品,为了和流失区分开来,需要选择无交集的时间范用,比如流失用户是60天以上没打开产品,那么不活跃则是0~60天没打开
3、回流用户:有一段时间没用产品,之后突然回来再次使用,则称为回流用户。回流用户是活跃用户,且是由流失用户或不活跃用户唤回而来
4、活跃用户:一段时间内打开过产品
5、忠诚用户:也可以叫超级活跃用户、长期持续使用产品,比如连续四周,或者一个月内15天等。
6、一般过程:
  A:新增—活跃—忠诚
  B:新增―不活跃一回流一活跃―忠诚
  C:新增一不活跃一流失
活跃用户指标可分为:
1、虚荣指标:阶段时间内凡有访问行为的用户都可以记为活跃用户。
2、可执行指标:阶段时间内用户产生了代表对产品认可程度的高频行为才算活跃用户,如每日多次访问、点赞、收藏、转发、留言、付费等相关行为代表用户对产品的认可程度。
3、访问次数代表用户每日使用产品的频次,对所有访问次数大于1次的用户做平均访问次数的计算,或者设定一个固定值,例如连续7天每日用户平均访问次数为3-5次,那么4就可以做为固定值,或者运营者认为每日访问次数大于2次就可以计算为活跃用户,那么2就可以做为固定值。基于访问次数的平均值或固定值,我们需要对每日大于1次,小于A*50%的用户,每日访问次数大于A50%并小于A的用户,以及日访问次数大于A的用户进行统计。目的在于通过访问次数将用户分层,高于A值的用户是绝对的活跃用户,对于没有达到A值的用户可以通过运营活动重点提升日访问次数。

(2)活跃率
   活跃用户数 / 总用户数,留存率反映的是留住用户的能力。

(3)DAU/WAU/MAU(Daily/Week/Monthly Active User 日/周/月活跃用户)

1、理解Active
 方法一:数据统计系统的定义
  (1)基于事件上报:有事件上报→该用户活跃
  (2)注意: 上报事件的标准定义可能会对后面的数据造成影响,假定了事件上报一定来自用户主动操作,很可能造成活跃暴增,其他数值并无显著增加。
 方法二:业务上的定义
  (1)基于关键事件上报∶用户执行了关键事件→该用户活跃
  (2)存在维护成本(需不断维护日活事件列表,因为日活事件列表会标的哪些事件和行为可以被计算为日活)和沟通成本(团队内外对「活跃」的认知需统一)
  (3)建议的解决方法,日活事件的列表每次更改需要全公司的人都知道,但是两种方法都有缺陷,要根据公司实际情况考虑。
2、理解User
 存在一个人用多台设备去访问公司服务器,和一个设备被多人操作去访问公司的服务器。所以计算日活是按照人去统计还是按照设备统计要考虑。
(1)按照人
 给每位注册用户一个唯一的专属ID(userid/uid)
 只适合强注册/登陆环境,未登录的用户会被漏掉
 用户数=访问过服务的ID数(去重)
(2)按照设备
 在网页cookie 中埋下一段长随机字符串,作为设备唯一标识符
 无法对应设备背后的用户
 用户数=访问过服务的设备数(去重)
(3)认人or认设备?
 1、是否有账号体系?
  Yes→认人
  No→认设备
 2、业务场景是否强依赖登录?
  Yes→认人+认设备
 3、不登录的用户对业务是否有价值?
  Yes→认设备
  No →认人+认设备

(4)新增用户数
   每个产品每日新增的用户数量,不同的产品定义新增用户的方式也不一样。

每个人都在提“新增”每个人认为的新增可能都不一样
 渠道可能认为:只要点了你们产品的下载按钮,就算一次新增了
 运营可能认为:总得下载成功了才算吧!而且一个用户一天最多算一次
 产品可能认为:我们按启动量算吧。没打开APP也算,数据质量太差了
 开发可能认为:注册了才叫新增「

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值