今天给大家讲一个凄美的故事
有“永不沉没”的美誉的“泰坦尼克号”
1912年从英国出发,驶向美国纽约
然而不幸的是
泰坦尼克号与一座冰山相撞
泰坦尼克船体断裂成两截后沉入大西洋底
2224名船员及乘客中,1517人丧生
其中仅333具罹难者遗体被寻回
以此背景,做出本节数据分析
一、数据来源
本节使用seaborn自带的泰坦尼克号生还乘客的数据集,其中各字节所代表的含义如下:survived alive乘客生还情况、pclass class船舱等级、sex who乘客性别、age 乘客年龄、sibsp parch是否带有家属,统一用alone字段代表是否有家属、fare船票价格、embarked和embark_town上船地点。
import numpy as np #导入库import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt%matplotlib inline
titanic = sns.load_dataset("titanic")titanic.head() #数据概览
二、问题研究