数据分析必备原理思路(三)


四、图文并茂的数据汇报与观点表达

1. 什么是数据表达?

  • 数据表达:就是基于数据化的表、图、文,说明事实表达观点

2. 数据表达的目的是什么?

  • 数据表达的首要目的:就是更好地说明现状、阐述事实,让大家都能基于数据准确地知道到底发生了什么
  • 做数据表达,目的不是简简单单地说明事实;要做的是用数据说服他人,认同我们自己想表达的观点;我们的说服能力越强,管理半径就越大;对应的职级也就越高,薪资水平就越高
  • 从专业上要求自己以后做出的每一幅图表,说出的每一句话都有理有据、让人信服
    能够基于数据准确地说明事实、表达观点,最后说服他人正是学习数据分析后最大的改变

3. 为什么要基于数据进行表达?

  • 数据有客观、量化两大属性,能帮助我们基于数据最大程度地统一人与人之间的认知,还能基于数据做各种计算拓展,进一步挖掘数据背后的信息, 而基于数据进行的表达则具有客观、直观、高效等优势
  • 数据表达三大原则:客观、直观、高效
    • 客观:做出的任何表图文都要基于事实,准确清晰,不能让人看了数据还有歧义
    • 直观:做出的图表一定要让人一目了然,直接获取到背后的有效信息,不然就浪费了可视化基于视觉进行表达的优势
    • 高效:图表天然比文字等载体承载更多的信息,做出的图表就要发挥这个优势,增大每次表达中的有效信息密度,这样才能基于数据提升我们的交流效率

4. 如何基于图表进行优质的数据表达?

  • 首先要清楚数据表达是在数据分析完成后进行的,此时我们应该已经有了成型的观点和结论,接下来数据表达的目的则是让我们的结论更加亮眼,起到更好的说服作用,日常生活中,数据表达的载体和形式主要有三种:

    • 1.基于图文的沟通对话
    • 2.基于PPT的汇报总结
    • 3.基于文档的专业分析
  • 其中,第3种需要搭建指标体系,评估业务策略,甚至要给出执行方案,对业务经验和分析基础都有一定的要求,属于3-5年的分析才能掌握的专业技能,日常生活中,80%以上的数据表达还是前两种形式。

  • 而这两种形式无论是沟通对话还是汇报总结,本质上都是围绕明确的主题,基于观点做出对应的图文,在这两种数据表达的形式下,每段的开头最好是不包含数字的主题句,这个主题句要给出明确的观点,然后补充这个观点的数据和相关信息,最后附上对应的图表。

  • 整体的表达格式是:观点+数据+补充信息+图表,例如此处对门店GMV占比的数据表达,就在一开始给出了鲜明的观点,随后具体说明了数据,并在后续补充了详细的数据和图表,这就让我们能够最高效地获得观点,并且分层获取对应的数据和信息,最后还能通过图表直观地感受到观点在数据上的呈现。
    在这里插入图片描述

  • 而要做出这样专业的数据表达只要三步操作就能完成:
    在这里插入图片描述

(1)提炼文字观点

  • 提出打破认知的观点
  • 注意,观点本就是主观的,没有绝对的谁对谁错,如果适当地夸张可以引起大家对问题的重视,并且,后面还会附上具体的数据和图表,只要数据准确,图表直观,没有扭曲事实那表达就是客观的。

(2)制作完善图表

a. 视觉映射原理与可视化优势
  • 经过视觉映射,你就能非常快速地通过视觉图形获取有效信息
b. 度量和维度
  • 度量
    • 数值型数据,又被称为【度量】Measures,一般是由数字组成的变量,例如:成交金额、用户数、点击量
    • 它们可以进行计算,并基于计算结果的大小映射到长度这类可量化的视觉图形上
  • 维度
    • 类别型数据,又被称为【维度】Dimensions,一般由各种字符串和分组标签组成,例如:用户ID、性别、注册渠道
    • 需要注意的是,这里的ID虽然是数字,但它们本质上还是对用户进行区分的一种标签,因此还是维度
    • 而类别型数据也就是维度,则通过颜色、形状这类难以量化的视觉图形对其它量化的视觉图形进行区分
c. 九种视觉图形

在这里插入图片描述
在这里插入图片描述

  • 长度
    对应工作场景中使用频次最高的条形图和柱状图,它们都是将数值的大小映射到图形的长短上,然后将图形横着放就是条形图,竖着放就是柱状图,
    在这里插入图片描述
  • 角度
    饼图为例,它就是将数值占整体的比例大小,映射到了饼状图形的角度上,然后再将各种类别映射到图形的颜色上,对饼状图形进行区分;而环形图只不过是将角度替换成了弧度。
    在这里插入图片描述
    在这里插入图片描述
  • 方向
    所谓的方向其实就是折线图中两点之间连线所指向的方向,它先将数值的大小映射到了点的高度上,然后用时间日期对点进行区分,最后在点与点之间连线,这样就将相邻日期间的数值变化,映射到了不同数值之间的连线方向上,从而我们视为呈现了数据的变动趋势
    在这里插入图片描述
    同时还可以将维度映射到颜色上,进一步对折线进行区分,从而在一个图表中比较多个类别的数据趋势
    在这里插入图片描述
  • 位置
    对位置运用最多的是散点图了,一张散点图至少包含两个度量和一个维度,度量会各自映射到横轴和纵轴上,而维度则会映射为一个具体的点,此时数轴上的度量值其实就是点的坐标,这样我们就能同时比较点与点之间在两个度量值下的大小。
    在这里插入图片描述
    以这张门店流量和营收关系图为例,横轴代表一家外卖店在平台的曝光人数,纵轴则代表门店的营业额,每家门店在平台的曝光人数被映射到了横轴的位置上,而门店的营业额则映射到了纵轴的位置上,每家门店则映射到了具体的一个个点上,通过这张散点图可以很明显地看出:拌客武宁路店曝光人数更高,但营业额却比蛙小辣宝山店更低,并且每家门店的流量和营收情况,都在这张散点图上一目了然
    在这里插入图片描述
d. 可视化领域四大金刚
  • 以上说到的条形图、饼图、折线图和散点图,在麦肯锡的统计下满足了企业日常经营生活中90%以上的分析需求,被称为可视化领域的四大金刚。
    在这里插入图片描述
  • 当然我们还可以将类别映射到形状上,起到和颜色一样的区分作用,我们常见的词云本质上就是用文本词汇自身的形状作了区分,然后将数值映射到了文本的面积大小上;同时将折线的下方填充并且堆积,做出堆叠区域图,这样就可以将数值的大小映射到每一个区域的面积上。当然我们也可以将数值映射到体积上也能起到相同的区分效果,需要注意的是在确定面积和体积大小时,要注意和边长或半径的数值换算问题,避免出现错误的视觉映射;最后我们还能将数值映射到颜色的深浅上,直观展示数据的大小,就像这张世界上最早的热力图,就是由法国人Charles Dupin在1826年发表在黑白地图上以从白到黑不同深度标示了法国文盲的分布情况。
    在这里插入图片描述
    在这里插入图片描述

e. 各场景下最合适的图表
  • 图表制作的两大场景
    • 为观点提供支持
    • 对数据进行探索/验证心中的假设
  • 出思路最简单的方法
    • 先给自己提几个问题,然后在图表里找答案
  • 合适图表的制作流程
    • 第一步:根据问题和观点选择合适的图表类型
      • 看规模:柱形图 or 条形图
        不管是什么数,只要是比大小,默认上柱形图,简单有清晰;如果需要对比的对象太多,则可以用条形图,这样可以横向展示标签。
        在这里插入图片描述
      • 看趋势:折线图
        所有随时间变化的数据趋势,统一用折线图呈现;多个对比对象就用颜色区分出多个折线图,看到时间默认用折线图准没错。
        在这里插入图片描述
      • 看占比:饼图 or 环形图 or 树图
        各类占比分析,之前用最经典的饼图比较多,但是现在普遍用更加美观的环形图,因为它俩在信息传达上的效率差不多,但是环形图中间还能放个总和或者数值名称,并且看起来也更加高级;但是在多对象的占比分析场景下,饼图和环形图切得太细就难以区分了,专业分析表达中往往会用树图进行区分,树图中越靠近左上角,矩形面积和占比也就越大,这样就可以在一个矩形中平铺非常多的分析对象,看起来也比饼图和环形图要来的直观。
        在这里插入图片描述
      • 看关系:散点图
        如果要同时在两个度量上对比一个维度,果断上散点图,比位置的高低远近即可,并且散点图还可以用来对比度量之间的相关性,只要基于散点图做个趋势线,斜率越大就证明度量之间的相关性越强。
        如果放到具体的图表中,这里位置上越靠近右上角的门店营业额和曝光人数肯定就越高;而越靠近左上角则门店单个曝光人数下的营业额就越高,意味着门店对流量的变现能力也就越强;而做出趋势线后我们可以发现曝光人数和营业额在所有门店上基本都成正比,有很大的相关性,这就意味着提高曝光人数有很大的概率可以带动营业额的增长,这也符合我们对业务逻辑的认知,并且通过趋势线我们也可以看出,蛙小辣在趋势线之上,这就可以证明这家门店单个曝光人数带来的营业额比其它门店的平均值要高,而拌客武宁路店则正好相反,此时这条趋势线不仅能体现出相关性,还能更加直观的区分出门店对流量的变现能力高低。
        在这里插入图片描述
      • 看分布:直方图 or 地图
        如果是单一度量的分布,直接用直方图,它可以统计各种数值出现的频次大小,直观展示数据的分布;此外,如果是跟地理位置相关的数据,它们的分布可以直接基于经纬度和行政边界(地图)做可视化,这样更加直观。
        在这里插入图片描述
      • 基本上这些就是日常工作中会遇到的大多数表达场景了,掌握好这些场景下具体该用哪些图表,就能解决90%以上的分析问题。
        在这里插入图片描述
    • 第二步:为图表准备数据
      那么在构思好当前场景下要用哪种基础图表后,就要为图表准备数据了,在拆解和量化问题之后,我们应该已经梳理出了解决问题所需要的数据;如果是论证观点 ,一样对观点拆解量化,然后梳理出数据,并且收集处理为数据库中的标准数据即可。
    • 第三步:通过工具制作图表
      准备好标准数据后,接下来就是通过工具制作出我们构思的基础图表了,而每个工具背后的可视化原理是相通的,都是将数据映射到具体的视觉图形上,只不过具体实现的操作不同罢了。
      • Excel是选择数据后直接选要做出的图表类型
      • PowerBI则是先选择图表类型,然后拖拽对应的数据
      • Tableau则是基于可视化原理,将数据拖拽到对应的视觉图形上直接出图具体的操作
        在这里插入图片描述
    • 第四步:优化视觉图形组合
      制作出基础图表后,就是优化基础图表的视图图形组合了,应遵循数据表达三大原则:客观、直观、高效。最后一步是为了制作出有效信息密度更大的高效图表,具体来说就是思考当前的图形组合下,能不能调整和增加视觉图形。
      以这幅散点图为例,我们将门店名称映射到了颜色上,用于加强门店的区分;但是这里可以做个调整,将品牌名称映射到颜色上,区分出门店分属哪些品牌,这样看颜色就能分辨门店归属的品牌,增加了有效信息密度;除此之外,还可以将商家实收映射到散点的面积大小上,这样可以通过大小就能判断商家实收,也就是毛利的高低,这样就添加了一个新的度量到图表上,再次增加了有效信息密度。 在这里插入图片描述
      但是,客观直观永远是高效的前提,如果一味增加视觉图形,导致图表杂乱无章,反而会提高理解成本,降低图表的表达效率。
    • 实在没思路怎么办?
      • 除了继续提升自己的拆解能力,在类似实战项目的场景下学习和积累各种分析思路外
      • 还有一个简单粗暴的方法,就是把以上五种场景的图表全做一遍,并且尝试各种图形组合,直到发现一些打破认知的东西,或者做出高效美观的图表
      • 虽然这么做效率很低,但在初学阶段还是挺有必要的,毕竟学习时的慢就是实战时的快,就当练习图表操作了,还能提高以后的工作效率
      • 当然,这种简单粗暴的探索模式只适用于学习初期,在工作后,在面对具体场景时,还是得深入思考层层拆解,基于自己的分析思路提出假设抛出观点,有明确的目的后再制作图表进行验证,这样才是最为高效的工作流程

(3)摆出关键证据

在图表制作完成后,我们只要基于图表提炼出能有效支持观点的数据就好了,在这一步中基本上就是看图说话,不过有一些规则要注意:

  • 时间日期要准确,说明年月日
    至少要给出今年和明年这样的相对描述
  • 对于大数字和小数点过长的数据,要四舍五入,并给出合适量级的单位
    例如218764元在文字表达中,可以直接用21万,具体的数字在图表中展现就好
  • 视对象使用术语和缩略语,不要跟业务拽专业指标,也不要跟技术说行业黑话
    例如金融领域会将0.01%称之为1个BP,有些人为了强调自己是投行和金融出身,也会在互联网场景下使用BP,有的领导还会特意要求,不过这其实增加了业务场景对数据指标的理解难度,基本上每个人都要去百度,所以各种术语要视场景使用,不然效率不升反降
  • 说大白话!!!语言表述越直白、越简单越好!!!不要兜圈子!
    例如,对本月业绩上涨贡献最大的是A业务部在某地区持续半个多月的努力,这么说纯纯是在标榜A业务部,对于这种表达,直接说 A业务部某地区业绩上升80%,是本月业绩的主要增量就好了,既直观又清晰。
    在完成以上三个步骤后,你可能会对自己的表达不够自信,此时,找你的好朋友或者同事和领导看一遍,如果他们能快速理解就证明没啥问题,如果有问题,可以根据以上的步骤和原则继续反复推敲,直到做出自己满意,别人认同的表达。

五、如何正确地学习与使用数据分析

1. 如何正确地学习数据分析?

它决定了我们在数据分析领域的专业上限以及成长速度

(1)搭建起属于自己的知识框架

  • 数据分析领域有没有一个可以解决所有问题的知识框架?
    • 理论上有,但实际上没有人能做到
    • 一个好的知识框架并不是穷尽解决所有问题,而是能帮助你在遇到新问题时,快速补充知识然后解决这个新问题
  • 初期可以先充分理解别人的框架并内化使用;遇到问题时,先看看已有的知识框架里有没有解决问题的方法;如果没有,便要果断学习新知识去解决问题,学会后更是要对新知识进行总结,归纳到自己的知识框架里;归纳到一定程度后,你甚至会完全放弃原有的知识框架,自己重新搭建一个
  • 比如:如何将人工智能场景的知识点与现有知识相结合?
    • 自己梳理出当前的知识框架,把算法领域的知识也总结出来,找到两个框架间相似的部分和联系

    • 方法: 比较两种知识框架在解决同一种问题时,各自的流程和思路 ,这样你就能快速比较它们之间的异同,然后对相同的地方进行总结,将不同的地方添加到自己或者适用场景更大的框架里

    • 以数据分析和算法这两个知识框架为例,其实他们之间的知识是交叉的,但如果不考虑算法领域的计算机知识,仅数学和统计学等理论,是可以和数据分析进行合并的,当然你也可以直接放弃现在的数分框架,直接学习数据科学领域的知识,把数分和算法知识一起融入到数据科学这个新的框架里
      在这里插入图片描述

    • 无论哪种方式,只有将学到的知识融入到自己的框架里才能算是真正掌握,形成自己的知识框架,是深入学习所有专业技能时的必经阶段,更是进行创新的前提条件

(2)靠自己解决问题

  • 如果没有新的问题产生,就意味着我们没必要更新自己的知识框架,更没有必要提升能力,而解决问题的过程,其实就是成长的过程
  • 当遇到问题时,我们不应该把它视为阻碍,而是应该看作我们成长的机会;学习时的慢,就是工作时的快,就算自己努力过,实在解决不了了,这个时候再去问别人也不迟;并且,在你独立解决问题的过程中,还会给你带来很多的额外收获
    在这里插入图片描述

(3)先学能用得上的

  • 有学习的需求更有实际的场景,学起来是最快的;等解决了当前业务场景的问题,再进行系统的学习才是正解
  • 如果是在职,应该根据工作需求选学你最需要或者感兴趣的章节进行学习,快速形成战斗力
  • 如果还没有工作场景,那么先学一个实战项目,快速形成战斗力,然后跟着进度查漏补缺则是更好的选择

2. 如何正确地使用数据分析?

这个问题关乎我们能否在工作场景中将数据分析的价值最大化

  • 虽然各个场景都能用上数据分析,但是记住数据分析永远只是一门强力辅助技能
    在这里插入图片描述
    所以一定不能只看量化的数据,大量非量化的业务细节和信息甚至连一线执行时的情绪都是不可忽略的,它们往往才是最终决定你的分析和策略最终能否落地实现价值的关键。
    也正因为此,在做数据分析时一定要反问自己三句话:
    • 输出的结论能不能理解
    • 做出的图表够不够直观
    • 给出的策略可不可执行
      只有做到以上三点,数据分析才能真正帮上业务,提升效率,最终帮你创造出它宝贵的价值

3. 数据分析如何价值最大化?

这个问题更是会直接决定我们学习这门技能后最实际的薪资涨幅

  • 做好高薪工具人只是优秀分析师职业发展的第一,借助数据分析为我们带来更大的职业发展空间和更多的选择机会
    • 体现综合能力
    • 实现快速晋升

系列文章

数据分析必备原理思路(一)
数据分析必备原理思路(二)
数据分析必备原理思路(三)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

毛媛媛

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值