初学数据分析(一)

目录

一、简介

二、为什么要数据分析

三、准备工作

1. 收集数据

2. 数据预处理

3. 数据分析模型

四、数据分析

1、趋势分析

2、多维分解

3、用户分群

4、用户细查

5、漏斗分析

6、留存分析

7、A/B测试与A/A测试

五、数据分析后工作


一、简介

定义:将数据收集整合,然后利用特定的方法去分析这些数据,从中发现规律或是得到结论。
目的:揭示事物运动、变化、发展的规律。
意义:提高系统运行效率、优化系统作业流程、预测未来发展趋势。

二、为什么要数据分析

数据分析一般是为了产品的发展而服务

主要目的在于:获得用户、留住用户、增加收益

而数据分析可以精确反馈这三点的状况,同样这也是最客观和准确的途径,为我们的策略提供参考。

三、准备工作

1. 收集数据

数据的来源主要分为两大类,企业外部来源和内部来源

外部来源 :外包购买、网路爬取、免费开源数据等;
内部来源:销售数据、社交通信数据、考勤数据、财务数据、服务器日志数据等;

常见开源数据平台如图:

2. 数据预处理

数据预处理方法主要有: 数据清洗、数据规约、数据变换

1数据清洗是通过填补缺失值、光滑噪声数据,平滑或删除离群点,纠正数据的不一致来达到清洗的目的。

(2)数据归约:随着数据量的增加,基于传统的数据分析变得非常耗时和复杂,往往使得分析不可行。数据归约技术是用来得到数据集的规约表示,在接近或保持原始数据完整性的同时将数据集规模大大减小。对规约后的数据集分析将更有效,并可产生几乎相同的分析结果。常见方法有维度规约、维度变换、数值规约等。

3数据变换:数据变换包括对数据进行规范化,离散化,稀疏化处理,达到适用于挖掘的目的。

3. 数据分析模型

常用数据分析模型,主要包括:对比分析、漏斗分析、留存分析、A/B测试、用户行为路径分析、用户分群、用户画像分析等。

四、数据分析

常用数据分析方法:趋势分析、多维分解、用户分群用户细查漏斗分析留存分析、A/B测试与A/A测试。

1、趋势分析

趋势分析是最简单、最基础,也是最常见的数据监测与数据分析方法。通常我们在数据分析产品中建立一张数据指标的线图或者柱状图,然后持续观察,重点关注异常值。

在这个过程中,我们要选定第一关键指标(OMTM,One Metric That Metter),而不要被虚荣指标(Vanity Metrics )所迷惑。

以社交类APP为例,如果我们将下载量作为第一关键指标,可能就会走偏;因为用户下载APP并不代表他使用了你的产品。在这种情况下,建议将DAU(Daily Active Users,日活跃用户)作为第一关键指标,而且是启动并且执行了某个操作的用户才能算上去;这样的指标才有实际意义,运营人员要核心关注这类指标。

 

2、多维分解

多维分解是指从业务需求出发,将指标从多个维度进行拆分;这里的维度包括但不限于浏览器、访问来源、操作系统、广告内容等等。

为什么需要进行多维拆解?有时候一个非常笼统或者最终的指标你是看不出什么问题来的,但是进行拆分之后,很多细节问题就会浮现出来。

举个例子,某网站的跳出率是0.47、平均访问深度是4.39、平均访问时长是0.55分钟。如果你要提升用户的参与度,显然这样的数据会让你无从下手;但是你对这些指标进行拆解之后就会发现很多思路。

3、用户分群

用户分群主要有两种分法:维度和行为组合。

第一种根据用户的维度进行分群,比如从地区维度分,有北京、上海、广州、杭州等地的用户;从用户登录平台进行分群,有PC端、平板端和手机移动端用户。

第二种根据用户行为组合进行分群,比如说每周在社区签到3次的用户与每周在社区签到少于3次的用户的区别,这个具体的我会在后面的留存分析中介绍。

4、用户细查

正如前面所说的,用户行为数据也是数据的一种,观察用户在你产品内的行为路径是一种非常直观的分析方法。在用户分群的基础上,一般抽取3-5个用户进行细查,即可覆盖分群用户大部分行为规律。

绝大多数产品都或多或少存在一些反人类的设计或者BUG,通过用户细查可以很好地发现产品中存在的问题并且及时解决。

5、漏斗分析

漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。漏斗分析模型已经广泛应用于网站用户行为分析和APP用户行为分析的流量监控、产品目标转化等日常数据运营与数据分析的工作中。

漏斗分析要注意的两个要点:

第一:不但要看总体的转化率,还要关注转化过程每一步的转化率;

第二:漏斗分析也需要进行多维度拆解,拆解之后可能会发现不同维度下的转化率也有很大差异。

 

6、留存分析

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。这是用来衡量产品对用户价值高低的重要方法。

衡量留存的常见指标有:次日留存率、7日留存率、30日留存率等等。

7、A/B测试与A/A测试

A/B测试是为了达到一个目标,采取了两套方案,一组用户采用A方案,一组用户采用B方案。通过实验观察两组方案的数据效果,判断两组方案的好坏。在A/B测试方面,谷歌是不遗余力地尝试;对于搜索结果的显示,谷歌会制定多种不同的方案(包括文案标题,字体大小,颜色等等),不断来优化搜索结果中广告的点击率。

这里需要注意的一点,A/B测试之前最好有A/A测试或者类似准备。什么是A/A测试?A/A测试是评估两个实验组是否是处于相同的水平,这样A/B测试才有意义。其实这和学校里面的控制变量法、实验组与对照组、双盲试验本质一样的。

 (PS:摘自https://mp.weixin.qq.com/s?__biz=MjM5MDI1ODUyMA==&mid=2672941692&idx=1&sn=b9277c3c7eddbea1f102238c84f4542b&chksm=bce2fe4b8b95775d72527d6779c5e082e8578950c21584616c5ddd1e58d03a20d1bcc1258db5&mpshare=1&scene=24&srcid=0924Bo9k9Xr2M72D8xy3Rumx#rd 有待深入了解。)

五、数据分析后工作

数据可视化:用图像表示数据,将数据更直观地展示出来,如图

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值