数据可视化——向木东居士学习 第一期

【数据科学家学习小组】之数据可视化(第一期)第一周 学习总结

本系列文章主要目的有两个:

  1. 从数据可视化的角度出发,总结一下现在无论是数据可视化还是报表开发、BI开发的工具和思路
  2. 从木东居士的学习小组学习到一些大厂的工作学习思路,让自己思考的更全面更成熟,完成的文档也更加全面、漂亮。

整体流程

确定主题

比如,银行分析不同城市用户的储蓄率、储蓄金额,电商平台进行双十一的实时交易情况的大屏直播,物流公司分析包裹的流向、承运量和运输时效,向政府机构或投资人展示公司的经营现状等,都可以确定相应的数据主题。

提取数据

  1. 确定数据指标

    业务的分析有很多不同的角度,也就存在不同的衡量指标。所以首先要确定分析主题下涉及的数据指标。

  2. 明确数据间的相互关系

    围绕数据指标确定相关的维度和度量以及相互关系。

    • 趋势型:

      通常研究的是某一变量随另一变量的变化趋势,常见的有时间序列数据的可视化。

    • 对比型:

      对比两组或者两组以上的数据,通常用于分类数据的对比。

    • 比例型:

      数据总体和各个构成部分之间的比例关系。

    • 分布型:

      展现一组数据的分布情况,如描述性统计中的集中趋势、离散程度、偏态与峰度等。

    • 区间型:

      显示同一维度上值的不同分区差异,常用来表示进度情况。

    • 关联型:

      用于直观表示不同数据之间的相互关系,如包含关系、层级关系、分流关系、联结关系等。

    • 地理型:

      通过数据在地图上的地理位置,来展示数据在不同地理区域上的分布情况,根据空间维度不同,通常分为二维地图和三维地图。

  3. 确定用户关注的重点指标(确定图表优先级)

    通过确定用户关注的重点指标,才能为数据的可视化设计提供依据,从而通过合理的布局和设计,将用户的注意力集中到可视化结果中最重要的区域,提高用户获取重要信息的效率。

确定图表

看板(图表)设计

  1. 布局设计
  2. 色彩主题
  3. 附加功能
    1. 筛选
    2. 联动
    3. 下钻

操作示例

  1. 选定销售额构成为分析主题

  2. 提取tableau Sample-Superstore数据

  3. 确定使用柱状图 表示不同分类的总销售额

  4. 进行可视化图表的优化

    添加筛选器,添加子维度,使用颜色表示利润维度

参考资料

主要

  1. 数据可视化(第一期)学习规划和参考资料
  2. 【数据科学家学习小组】之数据可视化(第一期)第一周(20191111-20191117)
  3. 数据可视化的四大过程
  4. 如何优雅地选择数据图表:时序数据和比例型数据!
  5. 数据人必读的一篇数据可视化文章【值得珍藏】
  6. 利用 Kettle + Redash 搭建简单的 BI 系统
相关推荐
©️2020 CSDN 皮肤主题: 技术黑板 设计师:CSDN官方博客 返回首页