数据分析可视化图表mysql_一、数据可视化基本流程/图表选择/指标分析

本文为转载及摘录自“公众号:木东居士”及其CSDN账号的推文笔记,具体链接如下所示。出于尊重原创者版权和劳动的考虑,在开头标注原文出处。笔者在此处转载和摘录,是为了使自己的这个专栏的体系更加系统化。《七天数据可视化之旅》第一天 数据可视化过程​blog.csdn.net54a2b51e20cc8e78f30f079ec341a026.png

可视化要的不是数据,而是数据告诉我们的事实。作为数据分析师,常常会遇到这样一个挑战:我们认识到数据可视化的必要性,但缺乏数据可视化方面的专业技能。部分原因可以归结于,数据可视化只是数据分析过程中的一个环节,数据分析师可能将精力花在获取数据、清洗整理数据、分析数据、建立模型,但在最终的展示沟通上力不从心。

这也是“写代码的干不过做PPT”的部分原因。实际上,只要掌握了可视化的技能,我们的工作就更容易受到leader的认可。可视化工具包括但不限于,Tableau,Excel,PowerBI,Python,R。

一、数据可视化基本流程

可视化之前:探索性分析与解释性分析

二者之间有很重要的区别:探索性分析指理解数据并找出值得分析或分享给他人的精华。这就好比,在牡蛎中寻找珍珠,可能打开一百个牡蛎(尝试很多种方法)才最终找到两颗珍珠。而解释性分析,我们迫切希望能够言之有物,讲好某个故事--专注于两颗珍珠。大多数时候我们汇报工作就是要做好解释性分析的工作。

可视化过程

一个完整的数据可视化过程,主要包括以下4个步骤:

确定数据可视化的主题

提炼可视化主题的数据

根据数据关系确定图表

进行可视化布局及设计图片来自:木东居士可视化元素由3部分组成:可视化空间+标记+视觉通道;

可视化空间

数据可视化的显示空间,通常是二维。三维物体的可视化,通过图形绘制技术,解决了在二维平面显示的问题,如3D环形图、3D地图等。

标记

标记,是数据属性到可视化几何图形元素的映射,用来代表数据属性的归类。根据空间自由度的差别,标记可以分为点、线、面、体,分别具有零自由度、一维、二维、三维自由度。如我们常见的散点图、折线图、矩形树图、三维柱状图,分别采用了点、线、面、体这四种不同类型的标记。

视觉通道

数据属性的值到标记的视觉呈现参数的映射,叫做视觉通道,通常用于展示数据属性的定量信息。常用的视觉通道包括:标记的位置、大小(长度、面积、体积...)、形状(三角形、圆、立方体...)、方向、颜色(色调、饱和度、亮度、透明度...)等。

二、数据可视化图表选择

数据之间的相互关系,决定了可采用的图表类型。常见的数据关系和图表类型的对应关系如下图所示:

表格

使用表格时,需要记住的一点是:让设计融入背景,让数据占据核心地位。不要让厚重的边框和阴影与数据争夺受众的注意力。相反,要使用空格来区分表格中的元素。

左表,框线过多容易扰乱阅读者的注意力,反之,三线表简洁干练,通常是论文及出版物表格样式的首选。

热力图

热力图是用表格的形式可视化数据的一种方法,在显示数据的地方(数据之外)利用着色的单元格传递数据相对大小的信息。

热力图绘制(excel2010版):选中数据--开始--样式--条件格式(你可以根据需要选择合适的条件格式)

折线图

我们通常可以借助折现图理解趋势,比如,时间序列的每年降雨量(每日将与量之和);在某些情况下,折线图中的线可能代表一个综合的统计数据,比如平均值或预测的点估计。如果你还想展示范围(或者置信区间),可以直接在图上进行可视化。

左图是多指标折线图,右图在折线图中展示范围内的平均值。绘制右图时:先绘制avg--max折线图,然后右键“更改图表类型”,选择“面积图”;

右键“选择数据”,添加min折线图;最后选中“min折现图”,右键“设置数据系列格式”,选择“纯色填充--白色”。

三、关于某个指标的分析

1.分析某个指标下降了;到底是为什么?

不能只是找现象,因为哪些省下降了,所以总的下降了,这肯定不行,而是要找到根本原因。

2.把很多问题统一有效地结合起来:BI应运而生;多种数据源相关联形成系统化的可视化图表;

一个图中结合5至6个图表;单一的图表没有任何意义;发现不了原因;

3.如上图所示,左边可能是用户信息表、用户行为表、商品报表明细(合起来就是一个什么样的用户在什么时候,购买了怎样的商品)【可能是在多个数据源,有的是CSV,有的是mysql数据库里面】;

把这些表关联起来,可能是一个lookup或者vlookup;然后要去除异常值、缺失值;

可视化图表:趋势:折线图。对比:柱形图或散点图;做渠道之间的对比、与上个月的对比、与竞争对手的调研数据的对比;

4.数据源变化了也没关系,powerBI里面的有个数据刷新按钮,可以把十月份的数据新加进去;

5.第一步导入数据源;就会在右侧出现

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值