数据分析思维扫盲

知识来源:接地气学堂1


前言


行文之初衷,建立知识树,因而不易速读,请君悉知。宜为工具书,按索引取之。独学而无友,必孤陋寡闻,请君赐教,不吝感激。循序图之,

数据分析介绍


一、基本认识

1. 数据分析定义

根据分析目的,用统计学的从数据中寻找信息形成结论。

  • 工作对象
    驱动业务:利用数据落地运营方法.具体的运营岗位提供相应的服务。包含,但不限于:提供报告报表、数据赋能、专题分析、数据产品。

  • 数据分析与挖掘的大致关系
    数据挖掘是分析的一种方式,统计学/机器学习的方法只是解决分析问题的工具

    一般数据分析 数据挖掘
    定义 分析方法业务模型,评估现状和修正不足 分析侧重于数学模型,发现未知的模式 和规律
    侧重 实际的业务知识 挖掘技术的落地,完成“采矿”过程
    技能 统计学、数据库、Excel、可视化等 过硬的数学功底和编程技术
    结果 需结合业务知识解读统计结果 模型或规则
  • 工作流程
    需求层——数据层——分析层——输出层

2. 需求层的工作概述

  • 定义:基于对业务的理解,决定分析的整体方向
  • 目标:最终要弄清,需要分析什么问题,怎么分析,要什么数据。
  • 流程:理解业务——理解需求——建立分析计划

3.数据层工作概述

  • 定义:处理数据,工作量最大,数据分析人的基本功,最浪费时间。
  • 要求:能得出适合分析的数据格式。
  • 工作:数据采集——数据探索——数据处理
    • 数据采集
      常用的搜集手段有:从数据库里取数、从业务指标当中取数,或者说从数据场景当中去取,问卷调查 、实验室试验、仪器设备的记录
    • 数据探索:把握数据的全面性和纯度。
      全面性:整体把握字段数、字段类型。是否包含了所有我们需要的字段,字段的数据分布。
      纯度:具体每个字段把握:脏数据,数据范围、格式和缺失程度。注意异常数据的规律,是否代表着某种特殊情况。
    • 数据处理
      应用工具清洗、整理、加工数据,主要方式: 增、删、改、查、计算。数据类型的转换 、数据的一致性处理 、 异常值和缺失值的处理 、数据形态的转换

4.分析层工作概述

  • 是什么:开始分析工作,最考验我们数据分析人思维的一个层级
  • 要求:得出合理的结论
  • 工作:方法+软件+业务,根据拟定的计划使用数据分析工具展开具体的分析

5.输出层工作概述

  • 是什么:展现信息/结论+落地方法+复盘经验。
  • 包括:结论—建议—执行—反馈—改进。

7.技术与能力

基础能力 作用 说明 其他
统计学
概率论
沟通表达
思维框架
业务能力: 各方业务知识
电子商务
用户运营
商品运营
工程能力
数据搜集 SQL
数据清洗与探索 : Excel
Python
KETTLE
数据建模 : Python
数据呈现 : PPT
BI
Excel

其他概念

关于数据工作的概念层出不穷,但万变不离其宗,数据分析思维是解决一切的核心

数据赋能

所谓数据分析赋能业务,可以做的是:
一量化现状,为赋能打下基础
二梳理问题,为赋能方向指路
三展开分析,为赋能优化效率
四监控进度,为赋能保驾护航
五总结经验,为赋能积累成果

  1. 赋能的直观含义
    赋能的直观含义,就是增强业务能力,提高业务效率。注意:赋能是用更高级的手段解决战斗,不是替代,更不是“你行你上啊”
    “二营长,你他娘的意大利炮呢!”——这就是最直观的赋能。没有意大利炮能不能打县城?能,当然能,李团长手下上万人马呢。可没有意大利炮,打城门口很累,要死很多人。战士们扛着梯子冲了那么多次都冲不下来。有了意大利炮,“咣!”一下就搞掂了,就损失一个老婆,这个投入产出比显著提升
  2. 赋能的方法
    1. 工具式赋能-意大利炮,通过提供高效率的工具
    2. 资源式赋能-炮弹。二营长只有17发炮弹,估计打完县城炮就用光了。我们可以提供更多炮弹。
    3. 知识式赋能-洋码子。意大利炮上全是洋码子,二营长看不懂,打炮只会贴着脸直射。我们可以提供操作手册,最好有个教官亲自教一下。
    4. 服务式赋能-炮车。二营长连辆吉普车都没有,炮全靠人来拉。我们可以提供一辆吉普车,帮他把炮拉上战场。
  3. 数据赋能的特殊问题
    15年前我们说数据赋能业务,大部分谈的是如何给领导做仪表盘,给业务员做跟进工具,做推荐算法、做响应算法提高外呼成功率,因为那个时代企业数据建设普遍落后。真的是没数据可用,所以需要做大量基础建设。
    现在说数据赋能,大部分谈的是如何让业务方重视、尊重、科学利用数据。我们看到的企业实际情况,是骄兵悍将不屑于看数据,虾兵蟹将学也学不会。最后数据报表不是没人看,就是沦为“证明老子很牛逼”的工具。完全没有派上应有的用处。当然是得想办法积极投身到和业务的沟通中去。平时多做科普(比如多多转发陈老师文章)让大家知道数据到底是干啥的,有啥用,能咋样用。在遇到项目的时候争取参与机会,从基础做起,不断提高业务方使用率,不断积累在业务上助力经验。

数据产品

真实的产品,是一个广泛的概念,并非是死板的BI+仪表盘。因为,业务使用频率和认可度,是第一位的。很多做数据的同学一提数据产品,就想着搞花里胡哨的仪表盘,很容易让数据产品变成“为做而做”,最后打开率不高,更不指望别人说自己好了。换句话说,只要业务能用起来,数字输出到哪里,炫酷不炫酷,根本没那么重要。
在这里插入图片描述

二.数据分析可以解决问题类型:

复杂问题是简单问题的叠加

1.“是多少”问题的解决思路

  • 工作:要用数据描述状况。

  • 单指标思路
    只用1个指标就能描述清楚状况,比如身高、年龄这种,是没有什么分析方法的,注意描述的维度:时间、角度。

  • 多指标思路
    描述很多指标,涉及:重点指标选择,指标展示方式。描述性方法:

    • AARRR
      AARRR都是围绕用户来说的,实际上只适用于用户运营,不是所有业务都能硬插这五个指标的。互联网行业增长黑客理论的五个大指标。
      需要注意的是,实际用的时候,还有很多二级、三级小指标,绝不是五个指标就完事了,切记。
    • 漏斗法
      围绕流程环节,任何流程都能摆一个漏斗出来,主要用来衡量流程转化率的指标。比如:互联网广告(站外页-落地页-促进页-转化页),B2B销售的售前流程也很长(销售线索-初次接触-沟通需求-展示demo-议价-竞标-签署合同),撸出来一个漏斗。
    • 杜邦分析法:
      用来拆解经营指标:原本是财务分析中用来衡量企业经营效益与财务指标的方法,现在被推广到拆解。比如销售金额=用户数付费率客单价。然后再层层拆解用户数,客单价构成。有意思的是,杜邦分析法拆出来的逻辑图会很复杂,所以很多人为了提高逼格直接把它叫“分析模型”……
    • 量、收、利、进、销、存:零售行业,无论线上线下都是这六个关键指标:总量、收入、利润、采购(进)、存货。和AARRR一样,有一堆二级三级小指标。
  • 要注意
    以上都是描述问题的方法,并没有解答问题,比如看到用户流失率75%所以呢?所以75%是好还是坏呢?描述+标准才能对问题做判断。所以才有了下边“是什么”的方法。

2.“是什么”问题的解决方法

  • 工作:“是什么”主指树立数据标准的方法,也包括定位对象(是谁、在哪里)

  • 解决思路:可以纯粹基于数学寻找标准,但实际中更多是基于业务经验,但业务经验也需要数据进行验证才知道是对的错的。因此,产生了“是什么”的两个步骤:探索标准的方法,验证标准的方法:

    1. 探索标准
      和到底要对几个指标进行探索有关。
      • 1个指标——切割线摆在哪,方法有:二八法、十分位法、ABC法。名字听着玄妙,当我们没有信心的时候,可以根据二八定律,把切割线摆在20%,也可以先拆10组或者若干组出来,探索下摆在哪里合适。
      • 2个指标——矩阵法,其实就是把两个指标交叉,分出四个象限,看看四类有没有明显特点。
      • 超过3个指标,用一些统计学的方法。在无标注的情况下可以用Kmean聚类进行分类探索,在有标注情况下可以用决策树。一般不建议直接交叉。即使只有3个指标,每个指标分3类,也会产生 333=27 类出来,在业务上太复杂了。由此可以看书:统计学/机器学习的方法只是解决分析问题的工具,就是这个意思。
    2. 验证标准
      找出来标准需要业务方来验证。好的标准要能清晰区分不同群体。比如女生说要相亲的男生身高180。那意味着179的人她真的不要,181她不会立即拒绝。如果176的她照样接受,就说明画出来标准没有区分度,要么是标准划分出了问题,要么就是做标准的指标压根就找错了。
  • 注意: 有没有用数据找标准,有没有验证过业务部门的标准,是从取数到分析的分水岭。 很多同学觉得自己没有做分析,不知道分析的是什么,核心原因就是手上只有数据没有标准。
    比如跑出来一个:本月底销售额3000万,可3000万又怎样呢?不知道。然而渠道部一看到月底销售额3000万,就大喊一声:肯定是华东大区藏了业绩,下个月头他们至少还要吐500万出来!这就是有没有评价标准的差距。所以平时工作中就得养成强烈的标准意识,这样才能进行真正的分析。

3.“为什么”问题的解决方法

  • 工作: “为什么”指探索问题原因。

  • 方法:很难仅通过数据锁定原因,是一个系统的过程,需要做齐量化-探索-假设-检验-总结全套流程,往往要内部数据+外部调研+业务判断+测试,共同努力锁定原因。严格来说,这里不是靠某个分析方法得出的结论,想仅通过数据分析找原因,是相当困难的,这一点切记切记。但是考虑到面试官还是很想听几个方法的名字的,我们可以这么说,找原因的方法可以分作经验推断与算法推断两种:

    • 经验推断就是经典的:归纳法与演绎法,具体到数据操作上,就是分组对比(归纳原因)和趋势推演(演绎判断)。实际中,当然是两种方法结合,不断逼近真相。比如:问为什么销售额下降,用归纳法就是将每一次销售下降的时候,相关症状指标列出来,然后做分组对比,看哪个因素影响下跌的厉害。用演绎法,就是假设销售下降就是因为人员流失/引流产品不给力/季节因素导致的,那么我做了相应调整:人员调动/上新品/等季节过去,以后应该销售能回升。
    • 算法推断:通过指标的计算发现潜在问题点,然后回归到业务里去验证,不是靠人工智能阿尔法大狗子汪汪一叫就把原因叼回来。可以简单理解为把上边经验推断的过程,量化为一堆指标的计算。比如相关分析虽然不能证明因果,但是能提供分析假设,拿到假设以后我们就能进一步验证,到底这种关系是真相关还是伪相关。因此,做分类的模型与计算相关系数的统计方法,理论上都能用来做这种探索
  • 注意:统计上的相关系数与业务中的相关关系是两码事

    • 一提探索原因,大家脑子自然蹦出来的就是相关分析……往往会以为计算个相关系数,丫就真的相关了。于是产生了“龙脉梗”2。面试的时候经常有同学在这里吹牛吹大了,被怼得体无完肤。相关系数在数学基础扫盲(12.4中有)

4.“会怎样”问题的解决方法

  • 工作:指预测业务走势。
  • 方法:首先大类上,预测分定性预测和定量预测两种。
    • 定性方法是基于业务经验和业务假设,来推测未来走势,并不全是拍脑袋,因为定性假设选取的场景和参数可以通过分析来获得,并不是完全没有依据。同时,对业务部门而言,定性预测时责权划分非常清晰,每个部门要做到多少业绩一清二楚,反而容易推动执行有两种推测法。

      • 经验推断法,一种是找一个类似的业务场景进行推测。比如马上上一款新产品,根据过往的经验,一般上市后T+N周销售走势应该是XX,所以类似的也该是这样。
      • 基于业务假设,比如新产品上市,假设推广部门传播力度为X,假设销售部门配备人员为Y,假设供应链的产品到货率是Z,之后套入杜邦分析法的模型进行计算,综合预测销量。
    • 定量的方法又分为基于时间的时间序列法,与基于因果关系的算法两类。比如比如预测店铺销量,如果用时间序列法,则根据过往1-3年销量数据来预测未来的销售数据。如果基于因果关系,则要引入与销售结果相关的变量(多元回归),比如店铺位置、店铺产品线、产品价格、顾客评价、顾客人数等等。

      • 注意:工作中真正操作的时候,要因地制宜选方法。
        • 定量预测看起来很复杂,很多同学会直观的认为复杂就是牛逼的。可实际操做过几次就会发现,**时间序列法对于环境变化不敏感,**容易被突发事件冲击。因果关系法可能采集不到足够的数据,导致模型预测精度很难上去。所以在工作中真正操作的时候,要因地制宜选方法。在面试的时候,要客观陈述建模效果。又有很多同学本能的认为,模型在测试集上跑出来的准确率越高越牛逼。连过拟合这种问题都忘了。结果在面试的时候被面试官怼穿,这都是很常见的哈。说话谨慎不是问题,被怼穿了才是。
  • 注意:一提到预测,大家脑子里会自然蹦出来很多很多统计学/机器学习的算法。具体的操作展开写内容太多,这里仅帮大家梳理下逻辑。细节可以后边慢慢更,或者大家自去看相关统计学/机器学习文章。

5.属于“怎么做”的方法

  • 定义:指综合判断状况,下分析结论,输出建议要实到个可执行的抓手上。
  • 方法:同时考虑到资源与需求,帮助找到实现目标的最佳方式。(所以,“又如何”是分析最后一步,因为往往做判断,需要做一大堆前期工作。需要搞掂了数据、搞掂了标准、了解清楚原因,做了预测以后,才知道怎么下结论。)
  • 判断标准很清晰,判断的指标很少,那下结论是很快速的,不需要复杂的分析。比如:女生说我就是不喜欢秃头的男生,那就看照片一票否决,来的非常爽快。这里不需要分析。
  • 在复杂判断中,有主观法和客观法两种。牵扯指标很多,指标形态很复杂的时候,就很难决定了。比如:小姐姐说我想要一个男的对我好(行为指标)有上进心(心理指标)有发展潜力(预测值)真心爱我(恋爱原因),这要求一出,就是个非常复杂的判断。
    • 主观法:就是基于人工判断(专家判断),只不过打分方式有很多种,直接打分再赋权重的往往叫专家法,打一个矩阵评分再计算的叫层次分析法(AHP)
    • 客观法可以通过因子分析(用方差解释率做权重)神经网络(算法训练权重),这样不依赖专家打工。
  • 注意:实际工作中,做评估的最大敌人是没标准,或者标准没节操。看到销量下降就试图甩给没有数据的外部因素,或者甩给目标定得太高,这样的话分析就没法做了。做评估第二大敌是所谓“业务识”,经常有业务部门跳出来“你做过业务吗?老夫从业10年都没见过这样的”。做评估的第三大敌是领导意见,领导就是不想下这个结论,你咋办?只能回来改ppt啊。所以你看,做评估的算法有很多,真正用起来少,还真不能怪我们没本事。

总结

  • 类型
类型 问题层次 问题描述 备注
直接解决 1.是多少 今天直播观看10分钟以上的人数是多少 不只是一个数,搭建数据指标体系也算“是多少”
直接解决 2.是什么 今天观看10n+人数70万一一不满意啊! “是什么”的关键是评价标准!找标准也是工作之
直接解决 3.为什么 为啥90%的人都看不到10分钟? 找原因的方法很复杂,需要配合测试和长期观察
直接解决 4.会怎样 果我做了X工作,观看人数会增加吗? 做预测的方法也多,很复杂,经常用到算法
直接解决 5.怎么做 上个抽奖,人数增加了,可其他指标降了呀! 高大上的叫法叫:综合评价问题,常涉及复杂评估
间接解决 6. 想不想 我要不要去签约几个美女主播回来? 转化为4:列出支持想法的理由,用数据验证/否定
间接解决 7. 能不能 我让美女主播露臼花花的大腿,会被查封不? 转化为5:(黑箱)数据测试(白箱)收集过往结果
间接解决 8.会不会 我到底该怎么做,才能合理合法的让 转化为4:从问题出发找原因/从手段出发找可行性
间接解决 9.该不该 我还是决定签美女,该不该现在干! 转化为5:(事后)评估效果(算)除证浮绿

思维导图如下:
在这里插入图片描述

三.数据分析思路如何建立

1 类是用数据描述问题,把问题量化。2345类都需要探索-假设-检验-总结的循环性的过程对常用方法的简单总结。解决后面的问题,通常要先解决前面的。

分析的思路建立

  • 理想情况:
    设定数据指标→数据监控过程→数据预警问题→分析问题→探索对策→进行测试→验证假设→总结经验→更新指标体系循环监控。“大厂经验”,其实只是这套流程运转的比较顺利而已。

  • 注意:

    • 分析思路跟具体工具关系并不大
      没有数据的年代,还有定性分析方法;有数据的年代,还有基于调查问卷数据的调查分析,有基于交易数据的经营分析,有基于用户APP/网站行为的“大”数据分析。数据来源越丰富,数据越准确,可用的分析方法越多,结果也越精确,但基本思路是一样的。
    • 核心:业务实践和科学思维
      “生搬硬套终成空;棋无定式方入门”。要基于业务灵活的变通,一切以范围内解决问题为核心。无论是数据产品赋能、数据赋能基本,形式不同,核心不变。
  • 思维方法:临床诊断疾病

    1. 调查研究,收集资料;
      手段:问诊、病历、体格检查、特殊化验与检查.
      要求:真实性、系统性、完整性。
    2. 分析、评价、整理资料;
      结合症状、体征、检查结果、理论知识、临床经验
    3. 提出初步诊断;
      为进一步诊断的前提或试验性治疗的方向
    4. 确立及修正诊断;
      结合初步治疗,进一步检查/诊断性治疗
    5. 最后确诊,进行治疗
  • 基本流程:

    1. 观察现象
      (冷、发抖、打喷嚏)——(市场口碑、业务反馈、指标变化)
    2. 结合原理
      (感冒的症状)——(业务逻辑+分析逻辑)
    3. 做出推论
      (感冒了)——(建立假设)
    4. 采取行动
      (吃药/扛过去)——(基于假设,采取业务动作)
    5. 验证假设(
      吃药3天/扛了3天)——(检验结果,积累经验)
    6. 进一步分析
      (症状消失/症状加剧)——(持续监控)
    7. 进一步行动
      (不理它/看医生)——(持续监控)

1. 理解业务——工作的前提

理解业务是需求分析的前提。

不理解业务不但无法赋能别人,而是自己需要别人赋能。看不到业务,看不懂业务,不知道业务进展、无法沟通,自然没法把分析逻辑和业务结果联系起来。需要深入一线了解:服务对象、业务流、管理流、数据流、业务现状等。业务的理解程度决定了后续:对需求的理解,分析方法的准确性、能采取的措施建议。

  1. 服务对象:谁是我的赋能对象。
    刚入行的菜鸟们喜欢笼统的说:业务。满脑子都是“copy模板、模型、公式”。业务并不是一个孤零零的、独立的个人。业务两个字背后,是非常具体的、复杂的维度:

    1. 各维度影响

      企业 行业地位 增长速度 发展方向
      行业 toC toB toVC
      部门 销售 运营 产品
      等级 部门总监 部门经理 小兵
      动机 寻求求助 证明自己 甩锅
      要素 决定事项 事项决定分析
      行业+企业 数据基础 战场 :数据的基础建设、对数据的认知程度、发展方向
      企业+部门 工作职 战略:工作定位、流程、人员、相关措施、制度、活动,有哪些历史遗留问题,过往经验
      部门+等级 关注重点 战术: 职责KPI/OKR、当前指标表现是什么,哪些分析指标反映了他的问题,有多严重
      等级+动机 具体要求 战斗:他希望从数据分析里得到什么结论,数据分析实际上可以帮他解决什么问题,ˇ还有哪些是可以帮上整约
    问题层次 说明 举例
    战略层 做哪个方向 我们要抓DAU指标?观看人数?观看次数?这个指标目标多少,要提高多少?
    战术层 已经选择了方向,县体做什么事情 我们决定了要抓观看时长,尽量让用户观看10分钟以上。那么问题是:我要找更优质的用户呢?还是改进直播体验呢?还是找一些大牛主播呢?
    战斗层 已经决定了做什么事,事情做的大小、多少 我们决定了签约主播,那么市面上有哪些主播可以签,签哪些游戏的主播?签来要播多少次,要不要搞个对抗赛让主播LoW一把,啥时搞气学
    1. 等级影响

      • 越是上层的领导,越会关心数据,但是他们只关心结果。需要总览全局的工具,看到结果、定位问题,调配资源。例如:BI+仪表盘
      • 越是基层,数据越没用,他们关心的是执行。需要简单、直接、可复制的武器,直接套用在流程中。例如:哪类客户是目标?优先顺序如何?卖点依次是什么?从话术到优惠如何促成交易?交易后如何维护?
    2. 部门影响

      部门 部门职责 行动方式 核心关注点
      销售部 直接对业绩负责,出业绩! 快速找到方法,然后各个业务线,各个团队复制、复制、复制,执行力最重要 这个月业绩有多少,我能不能借力活动作出业绩,如果能,还有没有人没借上东风,我怎么帮没借上东风的人借
      市场部 打辅助,提供活动作为工具 需要较长时间筹备(方案、系统、物料、宣传)策略性很重要,策略不对,努力白费 活动有没有效?活动有没有效,如果有效,下个月还做不做,如果没效,加码还来得及不?
      供应链 做支撑,保障产品供应,维持库存平衡 筹备周期非常长(备货、周转、生产排版)且开弓没有回头箭,(生产线一旦启动就不能停需要打提前量 预计销量如何,现有库存能维持多久,是否要增加供应
    3. 动机影响

      类型 对应部门 职责 关键 创新要求 数据要求 执行要求
      策略类 战略发展、产品管理、用户运营 梦想转为计划 部署和节奏 2 3 1
      创类 研发、设计、产品经理、品牌创意 创造价值 创造力 3 2 2
      执行类 销售、市场推广、媒体、社群、运营 只谈干货、钱 干!干!干! 1 1 3
      支类性 客服、售后、生产、供应、物流 支撑前线 1 2 3
  2. 业务流程:

  • 数据基本情况:拥有哪些数据,来自哪里,
    对象在做什么?分为几步做?得什么结果?数据流是什么?可以采取流程法思考,落实到数据。流程法:业务层上各业务是并行的,流程层上是有先后顺序的
    第一步,先梳理流程,
    第二步,确定每个步骤当中涉及到的一些业务点,
    第三步,根据每一个业务点去梳理量化其中的一些数据。
    案例:如何控制商品库存积压成本?

    商品生命周期 业务流程 需求 数据需求
    上架准备 商品定位、评级 商品定位是否科学,品级是否合理 成本、库存
    预热 宣传预售 通过预售反馈,预测第一批销里,验证品级合理性 预算、库存、广告费用
    上市 走量、补货 根据销售变化,预测未来销量判断LTV 销量、利润
    热销 促销、变现 根据销售变化,预测未来销量,预警库存 断货率、流失率、转化率
    稳定 控制库存 库存管理,活动预测 销量、周转率
    清仓下架 尾货处理 需要多久清完库存 周转、毛利
  1. 业务现状:
  • 核心指标,指标的计算方式。数据指标是业务的核心、业务的抓手,能够驾驭指标才能解决业务问题。
  • 业务反馈、指标变化。做了多少? 达到结果没有?卡在哪一步?理想情况:能用指标体系清晰量化情况,能基于数据诊断问题。需要有良好的数据采集、数仓建设、数据治理基础等较为完善的机制。
  1. 业务痛点:
    哪些地方是不满意的,想改善哪些问题。
    **决定发力时机的选择。**数据分析项目,最大的敌人是:日常工作。所以,并不是所有事情都适合立项目来做。时机非常重要。往往我们要挑业务部门的以下时机入手:想做创新、想改良现状、新工作两眼一抹黑、遭遇问题不知所措、三板斧砍完不见效

  2. 套路经验
    想找方案,就要先研究套路。大量数据分析一听“如何做”就怕了,因为我们不做具体业务,站在数据分析角度,关注的不是某个具体idea,而是哪个套路更管用结合数据,找到更好的套路,才是数据分析的作用。这里需要数据分析师对常用的业务套路所有了解。

  3. 业务需求
    有业务需求时,先不要着急跑数,牢记灵魂三问:

    • 这是个啥层级问题?
      服务对象决定
    • 这是个啥类型的问题
      数据分析可以直接解决的问题有五大类,可以间接解决的问题有三大类
    • 当前状态下要输出什么成果
    适用层次 适用场合 投入成本 效果
    临时取数 战斗层 “这个数据老板要,下班以前要搞定 看似投入少,需求一多,非常时耗力 几乎没有,不会有人注意你
    报表 战略层、战斗层 跟踪固定指标,发现问题 建指标体系耗时,后续维护简单 长期内大家都会看,但几乎没有人说你好
    专题分析 战略层、战术层 针对专项问题,寻找办法 无论啥时候都費时费力 短期内有效
    数据模型 战术层、战斗层 适合模型解决的特定问题 非常吃数据质量,想实现效果需要业务的配合 不是露脸,就是露屁股
    ABtest 战斗层 有具体业务方案情况下做测试 需要大量前期准备,有可能需准备很多个版本,开发压力大 工作量大,短期内有效,同意产生依赖
    数据产品 战略层、战术层 有经费/人力/时间的话尽量都做成产品,直观,好用 非常多经费/人力时间投入 需要培养用户习惯
  • 例如:
    套在电视剧里,如果你是总指挥,意大利炮简单,为啥我想不到?因为你既不是李团长,也不是二营长,也不是山本大佐。你的位置和电视剧里的总指挥一样:前线都打成一锅粥了,你还不知道发生了什么。哪里在打,谁在打,打啥,打的咋样了,完全不知道。如果有了以下信息会很快明了
    对象:李云龙这个混小子
    级别:战术+战斗
    现状:优势兵力,四面包围,打县城!三个方向已得手,唯一卡在城楼,攻不进去
    经验:围点打援
    痛点:城楼太高,敌人火力太猛,步兵冲不上去
    需求:需要时间、重火力

2.需求分析 —— 分析的前提

病人一般的小病是不需要医生的,同理,当需要分析辅助时一定是业务遇到无法理清的大问题。数据分析师要像医生对待真实的病人3一样。菜鸟确认需求完全依赖于:问业务、套模板;老鸟确认需求:具体情况具体分析带着经验、方案、逻辑……一步步引导业务到数据分析可以解决的问题上。

  1. 项目意识
    需要复杂的问题该立项做尽量立项做,不能立项做的也要有项目思维:项目目标、工作范围、输出产物、交付时间。有多大锅下多少米,如果数据质量差、人手不足、缺乏基础,缺乏经验、就沉住气一步步做,不指望一次解决所有问题。

    • 项目管理铁三角
      投入和产出是每份工作都要明确的。铁三角需要确认的质量、时间、成本。
      • 产出质量:
        包括:1.看清形式(数据、报告)2.找到问题(分析结论)3.对形式判断(分析结论)4.执行名单(分析结论/预测结果)。
        数字、模型、报告本身不是产出。业务从不了解情况到了解,从没有办法到有办法,从不知道怎么选到知道怎么选,从没有准备到一二三级预案,这才是产出。所以不要脱离问题就数论数。从数字里推出结论。
      • 时间:最迟什么时候要结果
        时间千万别忘了。时间紧,尽量快速出结论;时间宽,就要分步骤输出,企业不是学校留大半年给你慢慢憋论文
      • 成本:
        数据分析师的人手、加班时间、数据质量、业务配合度(缺一不可)
    • 沉淀与可复制
      要想办法沉淀些能复用的东西 ,面对同类分析需求每次都一个个从头研究,估计得忙到黄花菜都凉了,而且可以作为项目输出的一部分。例如:对主要的分析对象建立评估指标体系,沉淀一套评估方法论和监控指标,甚至有希望上一个小数据产品来做长期监控
    • 可执行
      解决怎么做,给出的建议要可执行。可以套用:5W2H。
      • where-在哪里搞
      • who- 谁来搞
      • what-搞谁?
      • why-目标
        目标模糊时需要得出大致的范围,结合趋势+目标进行计算.有个这个测算,我们就对宏观形势有了判断,可以争取资源,锁定工作范围.注意测算时模型尽量简洁:越简单越容易让不同知识背景的领导们达成共识。
      • when-多久
        目标要结合时间、措施、投入:投入是多少、每个阶段做什么、大致目标是多少
      • how-方案结合数据,找到更好的套路,
      • how much-投入
    投入/时间
    精致工程:合理规划&#
  • 10
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值