7周入门数据分析:(1)数据分析思维

**声明:**总结内容主要来源于秦路老师《七周成为数据分析师》的课程,以及老师本人在他的博客中分享的知识,在实践过程中,遇到一些问题也已得到解决,先将整个课程的学习内容做一个总结,不会像秦老师写得那么详细,只是从个人角度出发,取长补短,如果想详细了解课程内容,请访问秦老师的视频课程和博客。
(PS:并没有给秦路老师打广告)
思维是重中之重
作为一名仅有4个月实习经历,至今还在学校”深造“的科研狗,我必须和大家分享一条经验:
知识结构化远比知识更重要,脑子里应该装的是知识体系,而不是具体的知识。遇到问题难得的是解决问题的思路,也许你不知道怎么去进行one-hot编码,但是你应该知道什么时候需要将类别转化为one-hot形式,把那些硬性知识转到电脑(搜索引擎),而不是装进大脑。

1 金字塔原理

**核心:**层次化思考、逻辑化思考、结构化思考
**浅出:**任何一件事情都有一个中心论点,中心论点可以划分成3~7个分论点,分论点又可以由3~7个论据支撑。层层拓展,这个结构由上至下呈金字塔状
**举例:**我们活跃用户数在下降(中心论点),主要原因是竞争加剧(分论点),其次原因是新用户减少(分论点),老用户流失加快(分论点)。其中竞争加剧是因为竞争对手ABC出现(论据),新用户减少是ASO排名下降(论据)和渠道投入疲软(论据)造成,老用户流失是因为产品欠佳(论据)。
**工具:**Xmind(mac用户)
**法则1:**MECE,读作MeSee,全称Mutually Exclusive Collectively Exhaustive,中文意思是相互独立,完全穷尽。它指导我们如何搭建结构。
实际上我们很难真正做到穷尽,因为不了解的因素、隐藏的关键、信息不对称、经验等局限都会阻碍思维,做不到穷尽。另一方面,随着分论点的增加,结构会更加复杂,不便于梳理和总结,所以分论点需要强调在3~7之间。这里秦老师分享了一个 万能公式法,绝大多数的商业项目、数据分析、业务讨论,都可以抽象成公式。
**法则2:**假设现行。MECE是思考活动的技术和艺术,首先得有一个思考作为开始。这是什么意思?因为金字塔是从上而下,需要有一个中心论点,也就是塔尖。秦老师接下来举了两个灵魂案例:新人的缺点是什么?他们会以分析为乐,为分析而分析。试图找出一切关联、一切因素。如果我是新入行的产品经理,我会找出所有的竞品作分析,想产品的突破点在哪里。如果我是新入行的活动运营,我会试图分析所有的爆款活动,想一个完美的综合方案。可是结果真的能好吗?(我默默地举起小手,说的就是我)
什么是假设先行?就是以假设作为思考的起点。我不需要做全局的思考,而是先问出一个问题,然后思考解决它:我这款产品的特点在A功能吗?这款产品对用户们很有吸引力吗?我的活动如何在朋友圈引发传播?怎么让用户在活动中更爽?在做出假设后,引导思维去挖掘分论点,然后分析。比如我希望活动传播,我要考虑哪些人会传播,他们是因为利益引诱还是情感触动?传播的过程应该什么样,方便还是复杂?这样的分析思维,比堪堪想一个空中楼阁的完美方案靠谱多了。(强烈建议去读秦老师的博客,引人入胜)假设会被否定或者拒绝,我认为产品对用户有吸引力,但是最后所有的论据,包括留存率、用户使用时长、功能使用率、用户评价都是否定,那么吸引力也就不成立,此时应该修改假设:产品的某一方面有问题,然后继续画新的问题树。不要害怕修正错误的假设,不要寻找事实强撑错误的假设。
**法则3:**关键驱动因素(就是找到二八法则中的关键20%的因素)。
总结分析思维的思路:
提出假设—MECE原则(万能公式)—结构化分析—找出关键驱动因素—数据分析

2 建立指标体系

现代管理学之父彼得·德鲁克说过一句很经典的话:如果你不能衡量它,那么你就不能有效增长它。了解和使用指标是数据分析思维的第一步,接下来你需要建立指标体系,孤立的指标发挥不出数据的价值。和分析思维一样,指标也能结构化,也应该用结构化。
灰色字体为指标,ROI(投资回报率)
什么是好指标?
(1)好指标应该是核心驱动指标。虽然指标很重要,但是有些指标需要更重要。就像销量和利润,用户数和活跃用户数,后者都比前者重要。
互联网公司常见的核心指标是用户数和活跃率,用户数代表市场的体量和占有,活跃率代表产品的健康度,但这是发展阶段的核心指标。在产品1.0期间,我们应把注意力放到打磨产品上,在大推广前提高产品质量,这时留存率是一个核心指标。而在有一定用户基数的产品后期,商业化比活跃重要,我们会关注钱相关的指标,比如广告点击率、利润率等。
(2)好的指标应该是比率或者比例。
什么是坏指标?
(1)虚荣指标
(2)后验性指标
(3)复杂性指标
指标结构:指标也有固有结构,呈现树状。指标结构的构建核心是以业务流程为思路,以结构为导向。举例:从内容运营的流程开始,它是:内容收集—内容编辑发布—用户浏览—用户点击—用户阅读—用户评论或转发—继续下一篇浏览。
在这里插入图片描述
有了指标,可以着手进行分析,数据分析大体可以分三类,第一类是
利用维度分析数据
,第二类是使用统计学知识如数据分布假设检验,最后一类是使用机器学习。我们先了解一下维度分析法。
维度分析法:维度是描述对象的参数,在具体分析中,我们可以把它认为是分析事物的角度。销量是一种角度、活跃率是一种角度,时间也是一种角度,所以它们都能算维度,我们之前谈到的指标,都可以作为维度使用。有了维度后,就能够通过不同的维度组合,形成数据模型。数据模型可以从不同的角度和层面来观察数据,这样提高了分析的灵活性,满足不同的分析需求、这个过程叫做OLAP(联机分析处理)。数据模型还有几种常见的技巧、叫做钻取、上卷、切片
谈到维度法,想要强调的是分析的核心思维之一:对比,不同维度的对比,这大概是对新人快速提高的最佳捷径之一。比如过去和现在的时间趋势对比,比如不同地区维度的对比,比如产品类型的区别对比,比如不同用户的群体对比。单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值。

3 实践举例

**问题:**你是淘宝的数据分析师,现在需要你预估双十一的销量,你不能获得双十一当天和之前的所有数据。只能获得11月12日开始的数据,你应该如何预估?
答案提示:
外部数据:京东等其他平台双十一销量
内部数据
商品数据:商品评价率、退换货率、商品销量
支付数据:蚂蚁花呗支付比率等

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值