系统认识数据分析


前言

数据分析可以分为观测=>实验=>应用 三个部分
数据分析的目标:1.及时发现异常 2.找到数据之间的因果关系


一、观测

观测又可分为观察和测量两个部分
观察:采集数据 存储数据 展示数据;
测量:设定标准 发现异常 研究关系。

1.观测

1.1采集数据

一般采集数据分为四种方法:
(1)解析系统日志
(2)埋点获取新数据(自定义日志 基于系统日志新增数据 是数据分析师最常用的,也是最可控的)
(3)通过传感器采集
(4)爬虫 API(应用程序接口)

1.2存储数据

使用各种类型的数据库进行存储:如hive mysql等

1.3展示数据

通过各种可视化方式进行展示

2.测量

2.1设定标准

只有设定标准才能衡量判断异常

2.2发现异常

不符合设定标准的归入异常,而发现异常通常会有启发,并发现新的价值

2.3研究关系

使用可视化或建模推导相关性

二、实验

实验可以分为如下两个模块:
拆解问题 提出假设 设计实验;
收集数据 分析数据 验证假设

1.拆解方法

什么是拆解:拆解其实就是做加法,A=维度1+维度2+维度3+…。比如把优秀拆解成:1)有能力 2)个子高 3)家庭背景好 4)长的好看。也就是优秀=有能力(维度1)+个子高(维度2)+家庭背景好(维度3)+长的好看(维度4)

拆解只要符合MECE法则即可

1.1 流程拆解法

1.2 二分法:

二分法是把函数f(x)的零点所在的区间[a,b](满足f(a)●f(b)<0)“一分为二”,得到[a,m]和[m,b]。根据“f(a)●f(m)<0”是否成立,取出零点所在的区间[a,m]或[m,b],仍记为[a,b]。所对得的区间[a,b]重复上述步骤,直到包含零点的区间[a,b]“足够小”,则[a,b]内的数可以作为方程的近似解。

1.3 象限拆解法:

象限一:高点击高转化,点击高代表营销创意打动了受众,转化高代表被打动的受众是产品的目标用户;
象限二:高转化低点击,同样的,高点击代表被打动的受众是产品的目标用户,但低点击代表的是营销创意没有打动用户;
象限三:低点击低转化,这个象限是最糟糕的营销活动了,投放广告点击少,点击用户转化低,创意无效,用户不精准;
象限四:高点击低转化,这个象限的营销活动要给策划和文案加鸡腿,但就要给渠道扣绩效了。这种象限的营销活动一定程度上有标题党的嫌疑。
在这里插入图片描述

1.4 杜邦分析法:

杜邦分析法(DuPont Analysis)是利用几种主要的财务比率之间的关系来综合地分析企业的财务状况。具体来说,它是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。
杜邦分析法的基本思路
(1)权益净利率,也称权益报酬率,是一个综合性最强的财务分析指标,是杜邦分析系统的核心。
(2)资产净利率是影响权益净利率的最重要的指标,具有很强的综合性,而资产净利率又取决于销售净利率和总资产周转率的高低。
(3)权益乘数表示企业的负债程度,反映了公司利用财务杠杆进行经营活动的程度。资产负债率高,权益乘数就大,这说明公司负债程度高,公司会有较多的杠杆利益,但风险也高;反之,资产负债率低,权益乘数就小,这说明公司负债程度低,公司会有较少的杠杆利益,但相应所承担的风险也低。
杜邦分析法的步骤:
(1)从净资产收益率开始,根据会计资料(主要是资产负债表和利润表)逐步分解计算各指标;
(2)将计算出的指标填入杜邦分析图;
(3)逐步进行前后期对比分析,也可以进一步进行企业间的横向对比分析。

1.5 AARRR:

AARRR是Acquisition、Activation、Retention、Revenue、Refer,这个五个单词的缩写,分别对应用户生命周期中的5个重要环节。
(1)用户获取(Acquisition)
运营一款移动应用的第一步,毫无疑问是获取用户,也就是大家通常所说的推广。如果没有用户,就谈不上运营。
(2)用户激活(Activation)
很多用户可能是通过终端预置(刷机)、广告等不同的渠道进入应用的,这些用户是被动地进入应用的。如何把他们转化为活跃用户,是运营者面临的第一个问题。
(3)用户留存(Retention)
有些应用在解决了活跃度的问题以后,又发现了另一个问题:“用户来得快、走得也快”。有时候我们也说是这款应用没有用户粘性。解决这个问题首先需要通过日留存率、周留存率、月留存率等指标监控应用的用户流失情况,并采取相应的手段在用户流失之前,激励这些用户继续使用应用。
(4)获得收益(Revenue)
获取收入其实是应用运营最核心的一块。极少有人开发一款应用只是纯粹出于兴趣,绝大多数开发者最关心的就是收入。即使是免费应用,也应该有其盈利的模式。收入有很多种来源,主要的有三种:付费应用、应用内付费、以及广告。付费应用在国内的接受程度很低,包括Google Play Store在中国也只推免费应用。在国内,广告是大部分开发者的收入来源,而应用内付费在游戏行业应用比较多。
(5)推荐传播(Referral)
以前的运营模型到第四个层次就结束了,但是社交网络的兴起,使得运营增加了一个方面,就是基于社交网络的病毒式传播,这已经成为获取用户的一个新途径。这个方式的成本很低,而且效果有可能非常好;唯一的前提是产品自身要足够好,有很好的口碑。从自传播到再次获取新用户,应用运营形成了一个螺旋式上升的轨道。而那些优秀的应用就很好地利用了这个轨道,不断扩大自己的用户群体。

1.6 PEST:

pest是指影响所有产业和企业的宏观因素分析。其中,P是政治(politics),E是经济(economy),S是社会(society),T是技术(technology)。

1.7 RFM:

RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。

1.8 SWTO:

SWOT是一种战略分析方法,通过对被分析对象的优势、劣势、机会和威胁等加以综合评估与分析得出结论,通过内部资源、外部环境有机结合来清晰地确定被分析对象的资源优势和缺陷,了解对象所面临的机会和挑战,从而在战略与战术两个层面加以调整方法、资源以保障被分析对象的实行以达到所要实现的目标。SWOT分析法又称为态势分析法,是一种能够较客观而准确地分析和研究一个单位现实情况的方法。SWOT分别代表:strengths(优势)、weaknesses(劣势)、opportunities(机遇)、threats(威胁)。

三、应用

应用可以分为如下两个模块:
制定策略 实施策略 反馈迭代;
训练算法 优化算法 使用算法

通过应用创造价值的两种方法:

1.将数据应用于业务

基于数据反馈不断迭代产品和业务策略
在这里插入图片描述

2.将数据应用于算法

基于数据训练算法,让机器自动化完成任务(设定目标是算法的前提条件)
在这里插入图片描述

总结

所有未经事实数据验证的想法都是假设!!!
因为数据是客观统一的,只有数据的支持才能称为真理,才可以得到大家的认同。

  • 1
    点赞
  • 2
    评论
  • 2
    收藏
  • 打赏
    打赏
  • 扫一扫,分享海报

评论 2 您还未登录,请先 登录 后发表或查看评论
©️2022 CSDN 皮肤主题:数字20 设计师:CSDN官方博客 返回首页

打赏作者

浮生小饼干

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值