一、数据简单拆分
导入电影数据,数据源如下:
可以看到很多字段都是中英文、数字混合在一起,比如累计票房,我们要用来绘图的只有数值,中文是多余的,如果同一字段下的数据格式差不多,我们可以右键使用拆分,自动将同一字段下的数据根据不同格式或数据类型等拆分成多列新字段,例如对“让子弹飞(2010)Let The Bullets Fly”进行拆分,可以得到三个新字段,“让子弹飞”,2010,”Let The Bullets Fly“,对“累计票房12658.1万”可以拆分为只有一个数值字段12658.1,
例如对电影名拆分,如下:
我们只有保留中文电影名字即可,另外两个右键删除,右键可以对列进行重命名。另外,原表中的“电影名”这个字段我们也不需要使用了,可以隐藏,这样在建立工作表时不会显示该隐藏字段。
注意:重命名时名字不可与其他已有的字段重复
另外,对于一些字段直接拆分会出现不符合我们要求的数据,例如”上映时间“的拆分,
会把年月日拆分为三个字段,所以我们要用到自定义拆分,通过分隔符拆分,这里选择第一个左括号”(“作为分隔符进行拆分,如下:
拆分后只有一列,
对所有字段进行处理后的数据如下:
我们还要改一下新增的字段的数据类型,查看新增的“上映日期”这个字段,发现是字符串类型,要把它改变为日期类型,其他需要改的也要根据其字段信息作出适当改变。
二、绘制折线图
1. 电影数量变化折线图
列拖入"上映日期"字段,行拖入"Sheet1(计数)"字段,图形如下:
左侧字段是我们处理后的数据,上映日期是按年划分的,我们也可以选择季度、月等划分。另外,可以看到列有缺失值NULL,我们直接右键排除数据。
再把"Sheet1(计数)"字段拖入到标签中就可以显示具体数值了,图形如下:
可以看到电影从2008年到2015年都是处于增长状态,其中2011-2012年和2014-2015年增长速度比较大,2008-2011年和2012-2013年处于平稳增长状态,2015-2018年处于缓慢减少状态。如果想要对某个年份作标注,比如标注最大值,我们可以
然后编辑注释如下,可以设置字体大小、颜色、位置等
可以得到如下由文本框和线组成的注释:
选中框右键选择设置格式可以设置框和线的样式,
最终图形如下:
2. 电影票房变化折线图
这不和上面一样吗?把“上映日期”和“电影票房(万)"分别拖入列和行不就行了,拖入后图形如下:
这根本就不是图啊,原来“电影票房(万)"这个字段是属于度量名称的,不是度量值,即使它是数值类型也无法作图,我们把“电影票房(万)"拖到下面来就是度量值,再把它拖入行中即可绘制图形,如下:
对于NULL值要排除,另外,看到这些数值是不是觉得不太直观,总感觉要花点时间才看懂是多少,那么我们可以改变其数值的格式,右键行中的字段“电影票房(万)" -> 选择设置格式,出现如下界面:
可以设置数值的对齐方式,朝向,数值的小数位数,单位,含义等等,设置完并把NULL排除后图形如下:
由折线图可知,电影票房从2008-2015年都是处于逐年增长的状态,在2014-2015年增长尤为迅速,在2015-2016年有小幅度下降,2016-2018年票房回升。
3. 某一年电影票房和数量的折线图
怎么选择某一年呢?
我们可以把"上映日期"字段拖入到筛选器中,出现下图筛选器字段,选择年,再选择某一年,最后确定,那么我们使用"上映日期"字段时筛选器中会帮我们筛选出2016年的数据了。
把"上映日期"字段拖入列中,"Sheet1计数"和”电影票房(万)"字段拖入行中,可得到以下图形:
因为两者的数据是不同的,要分别设置两个图的标签,颜色等参数。图形如下:
由图形分析可知,2016年,3月-12月随着电影数量的升降,票房数据和电影数量是相同趋势的。只有1-2月是反常的,电影数量下将,票房反而升高,这是因为1-2月是春节档期,看电影的人较平时会大幅增加,电影虽少但票房也可以大幅增加。
三、绘制饼图
1. 价格等级饼图
可以先把“价格等级”字段拖入到列中,“(酒店数据)计数”拖入到行中,显示的是条形图,我们点击右边智能推荐中饼图的形状就可以自动将当前图形转换为饼图,如下:
再把“价格等级”和“(酒店数据)计数”拖入标签中即可显示数据,显示的是不同等级酒店的总数,我们可以右键选择 “(酒店数据)计数”-> 快速表计算-> 合计百分比,就可以显示不同等级的占比
除了使用智能推荐转换为饼图,在标记框中可以选择饼图,把“价格等级”拖入到颜色中,把 “(酒店数据)计数”拖入到角度中就可以显示饼图的基本形状了,再把“价格等级”和“(酒店数据)计数”拖入到标签中可以显示具体等级和数据,在快速表计算中选择合计百分比即可显示不同等级酒店占比,如下:
2. 环形图绘制
Tableau中没有直接生成环形图的方法,我们可以让两个大小不同的饼图以同一圆心重叠,再把里面的饼图挖去即可。先把“价格等级”拖入到颜色中,把“(酒店数据)计数”拖入到角度中,最后把“(酒店数据)计数”两次拖入到行中生成两个相同的图行,如下:
对行中的两个“(酒店数据)计数”右键 -> 快速表计算 -> 排序(就是最小值)即可将两个图的数据转换为以相同圆心的饼图,
再把其中一个图的大小调大,注意不要再标记区域“全部”中改大小,这个是所有图一起改的,我们任选两个图中的一个即可。
对行中第二个字段“(酒店数据)计数”右键选择双轴可合并两个图形,如下:
把第二个图的“颜色”标签拖出去,并设置为白色,就可以挖去小的饼图,如下:
最后把“价格等级”和“(酒店数据)计数”拖入第一个图的标签中就可以在整个图的外面显示数据和等级,如下:
注意:如果使用智能推荐将条形图转换为饼图,再把“(酒店数据)计数”字段两次拖入行中生成两个相同的图形,设置最小值生成饼图,你会发现不论调整哪个图的大小,两个图都会一起变,
因为在全部和两个图中都以“(酒店数据)计数”字段作为大小,所以要把全部中的大小标签拖出去(两个图的大小标签都没了),或者拖掉任意一个图的大小标签即可解决该问题。
若有错误之处,欢迎指正交流学习~~