-
分析目的:分析泰坦尼克号数据中不同舱位、不同性别的生还者分布,以表格的形式展示出来。
-
分析结果展示:
* -
分析结论:从性别来看女性生人数比男性高,从不同舱位来看头等舱生还人数最多、三等舱次之、二等舱最少,从总体来看:在所有舱位中女性均比男性生还人数高。
-
1.使用tableau打开数据集:
其中各字段含义为:
PassengerId ,乘客的id号,这个我觉得对生存率没影响。因为一个人的id号不会影响我是否生存下来吧。这列可以忽略
Survived ,生存的标号,上面图的数值1表示这个人很幸运,生存了下来。数值0,则表示遗憾。
Pclass ,船舱等级,就是我们坐船有等级之分,像高铁,飞机都有。这个属性会对生产率有影响。因为一般有钱人,权贵才会住头等舱的。保留。
Name ,名字,这个不影响生存率。我觉得可以不用这列数据。可以忽略
Sex , 性别,这个因为全球都说lady first,女士优先,所有这列保留。
Age , 年龄,因为优先保护老幼,这个保留。
SibSp ,兄弟姐妹,就是有些人和兄弟姐妹一起上船的。这个会有影响,因为有可能因为救他们而导致自己没有上救生船船。保留这列
Parch , 父母和小孩。就是有些人会带着父母小孩上船的。这个也可能因为要救父母小孩耽误上救生船。保留
Ticket , 票的编号。这个没有影响吧。
Fare , 费用。这个和Pclass有相同的道理,有钱人和权贵比较有势力和影响力。这列保留
Cabin ,舱号。住的舱号没有影响。忽略。
Embarked ,上船的地方。这列可能有影响。我认为登陆地点不同,可能显示人的地位之类的不一样。我们先保留这列。
- 2.但是这样看的时候pclass和1,2,3并不友好,我们可以为他们起一个别名使图表更加友好。在数据源中右击pclass,点击别名。
*
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/704ff93a9e169dd98e66fc2d01be8855.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/d38df1a957a04f73b5dd6b7103a12194.png)
- 3.把class从度量变为维度:直接把pclass从度量拖动到维度
*
![变化之前的](https://i-blog.csdnimg.cn/blog_migrate/6d8745be421a46bf40a664849039e5a0.png)
- 4.以pclass拖动到行,survived拖动到文本显示。在右边直接就显示出来了每一个舱位的逃生者情况。
*
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/7c7cf51cd5dc291f3867d9d2933aa0bf.png)
-
5.我们在此基础上想看一下不同舱位不同性别的逃生情况,只需要把sex拖动到列当中即可。
* -
6.这样只能看到每一个舱位,每一个性别的逃生人数,如果我们想看总人数,需要如下设置,分析-合计-把显示行总和和显示列总和勾选上去,勾选之后就会显示完整的表格统计。
*
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/4c5bef198efc1301a77d904a2e68cc6a.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/1d1f6a9e7dd347af53aca4b946dc901b.png)
- 8.当然我们也可以按下面操作交换行列值,变换另一种显示格式,使表格更加清晰。
*
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/b342453a670c688d6fdc99ea3f002845.png)
9.最终扩展,在页面的最右侧含有智能显示功能,该功能智能提供了,所编辑数据可以使用的图表,前三个为表的不同显示,可以使表更加美观。
*
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/f1f616af9153453461459df0a5f853af.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/b193a33086fbeb59b35a2602ebda83be.png)
注: 数据集链接:链接: https://pan.baidu.com/s/1O44gbPa7lTa5Tfr4_Btetw 密码: hu46