数据来源:“Kaggle泰坦尼克号挑战杯”竞赛泰坦尼克号数据
PS:需要创建一个帐户才能访问数据。
下载的数据是.CSV格式
1. 数据介绍
数据集中共有12个字段,PassengerId:乘客编号,Survived:乘客是否存活,Pclass:乘客所在的船舱等级;Name:乘客姓名,Sex:乘客性别,Age:乘客年龄,SibSp:乘客的兄弟姐妹和配偶数量,Parch:乘客的父母与子女数量,Ticket:票的编号,Fare:票价,Cabin:座位号,Embarked:乘客登船码头。 共有891位乘客的数据信息。其中177位乘客的年龄数据缺失,2位乘客的登船码头数据缺失,687位乘客的船舱数据缺失。
2.分析角度
所有好的数据分析项目都是从回答问题开始的。 现在,我们已经知道了列类别的数据,让我们来思考一些我们想从数据中得到的问题或见解。 这里有一个问题列表:
一些基本的问