目录
前言
理解这场疫情对美国造成的影响,我利用Tableau制作了这个动态的可视化看板,通过数据可视化的方式,直观地展现美国疫情期间的死亡人数变化趋势、地域分布差异等等。
说明:
这个用于记录我在学习Tableau的一个小项目,欢迎各位大佬指点。
在进行可视化之前,如果没有Tableau基础可以先去b站看看戴师兄的教程熟悉一下,视频链接我放在这里了:https://www.bilibili.com/video/BV1ZM4y1u7uF?p=3
有些细节像是字体、美化等等我这里就不重复提及了,师兄视频里都有,大家可以先去学习一下。
数据导入
我们把数据下载好后,直接通过Tableau导入数据,然后先对数据进行小处理,保留我们需要的部分,删掉我们不需要的部分。
好的,在我们导入通过文本文件导入数据以后,我们优先把每一列的名称更改为中文,更方便我们进行布局。
更改前:
注意了,其中有的一些列,比如Data Source Name 数据来源,和国家的多种名字这一块,在我们分析的过程中一般是不会用到的,所以我们就选择隐藏掉这一个数据来源 (右键隐藏即可)
更改后:
保留的地方是可以对着远端字段名来进行参考的,修改完字段过后可以重新查询一下来检查
在这里可以看到,我们的洲和县是存在空值的,简单排序检查过后我们发现,只是部分的国家存在空值,美国的州县就是正常的,部分国家可能没统计到州和县。然后我们就可以接着往下操作,打开工作表了。
地图数据动态可视化
在我们进入新的工作表后,我们可以看到左边的一列数据:
其中的带有地理位置信息的数据tableau已经帮我们智能识别出来了,我们只需要双击州即可显示:
但是这里没有显示,是因为我们的默认地区是中国,我们需要调成国家,州,让tableau自动获取:
因为我们主要是分析美国的疫情消息,所以我们要把国家放到筛选器内,选择 Unite States:
随后再把累计死亡放到大小及颜色上,就可以根据球的大小及颜色来确定累计死亡的人数:
随后,我们要添加最重要的动态变化,把日期拉到页面上,并且右键把它改成天的模式,此时我们的状态栏就是这样的:
另一边是这样的:
我们就可以选择我们想要的速度,点击开始,累计死亡的圈子就会随着时间的变化而变大变小。
折线图
折线图就会比较好做,只要确定好行与列就可以了,很显然,我们要做的是与死亡相关的动态可视图,所以我们的行就是累计死亡,列就是日期(改为天数的日期) ,一样的,日期还是要拉到页面这一块来实现动态的变化。注意一点,之前我们设置的日期和国家的筛选器可以右键选择应用于工作表,并选择对应的工作表,到时候制作看板的时候就可以实现动态的看板变化了。
直线图的呈现:
数字提示
接下来是一个数据提示,也就是随着时间的变化,死亡人数多少的变化,这可以给人一个更加直观的感受。具体怎么设计很简单,我们只需要把累计死亡拉到工资表中,再按住Ctrl,再把累计死亡拉到标签上即可,注意页面和筛选器同上,效果如下:
柱状图
首先,我们这个柱状图是为了动态地展示各个国家随着时间的变化新冠累计死亡人数的变化,而不单单是美国这一个国家,因此,之前国家的筛选器不应该作用于这一个表,只需要日期作用于这个表即可,同样的,页面这一块也需要日期拉进来,和上面一样调试将然后,就到了要确认行和列的时候,我们把累计死亡拉到列,国家拉到行这一块,在排好序后可以得到下面这个视图:
但是我们发现,在我们拉动时间的变化时,虽然柱状图也在变化,但是没办法实时地按照数量的多少来变化,这时我们就要新增一个度量,编写一下rank函数,来让柱状图随着时间的变化排名也会跟着变化,新增度量如下:
新增完度量后,我们将其拉到和国家并排的行上,并右键把它调成离散模式,此时我们可以得到:
最后我们只需要 再右键死亡排名,选择编辑表计算,把计算依据改为特定维度,选择国家即可
这时我们就已经得到了完整的柱状图,如果想只选择一部分展示,就要先把页面上的天(日期)拉掉,用鼠标选择要的那一部分,再把其拉回来就可:
看板制作
OK ,现在我们需要的工作表都已经做好了,在左下角选择新建看板即可开始我们的看板搭配,在看板的搭配上,我们现将看板设置成一个比较通用常见的大小:
我们可以选择直接拖拽进入看板,按照自己喜欢的样板进行排版,选择部分表浮在某些表上,或者整齐划一地分布都可以,再调一下背景颜色,删掉多余的日期控制等等,我们就可以得到一个动态的看板了,这个地方每个人的审美不同,大家按照自己喜欢的来即可,我的看版是布置如下:
这样就可以得到了一个动态的可视化看板,这个控制器也可以放在看板外边,按照个人的喜好来即可。
感谢大家的观看!