1912年4月15日,在首次航行期间,泰坦尼克号撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。这场悲剧轰动了国际社会。沉船导致遇难的原因之一是没有足够的救生艇给乘客和船员。虽然在这场灾难中幸存下来有一些运气在里面,但一些人比其他人更有可能幸存,比如妇女,儿童和上层阶级。
1.数据描述
survival - 是否幸存(0=幸存,1=遇难)
pclass - 船票类型(1=一等票,2=二等票,3=三等票)
sex - 性别
age - 年龄
sibsp - 泰坦尼克号上该人员兄弟姐妹的数量
parch - 泰坦尼克好上该人员父母或者子女的数量
ticket - 船票编号
fare - 乘客票价
cabin - 客舱号码
embarked - 起航运港(C = Cherbourg, Q = Queenstown, S = Southampton)
boat - 救生艇的编号(如果幸存)
body - 人体编号(如果遇难并且尸体被找到)
home.dest - 出发地到目的地
2.数据分析
2.1 幸存率分析
计算显示只有38%左右的乘客幸存下来,这次惨剧发生的原因是泰坦尼克号上并未携带足够的救生艇,只有20艘,这对于1317名乘客和885名机组人员来说还远远不够。
2.1 阶级地位分析
我们可以看出来头等舱对乘客有62%的生还几率,相比之下三等舱对乘客只有25.5%的生还概率,此外客舱越豪华,乘客的年纪也就越大,同时一等票票价明显高于二三等票。