关注头条号,私信回复资料会有意外惊喜呦………………最后一张照片有资料呦。
| 导语 适用于数据分析小白们~ ------ up主也是小白一枚,大加一起交流哈
写在前面的话:
1、项目来源于up主自学udacity中的一个项目实践,up主自身能力不足,因此文章很浅显
2、泰坦尼克数据集是kaggle中一个好的可选数据集,网上有很多基于此数据集的分析&存活预测实践的文章
3、要有点python基础哦~ 没有也没关系,先下载软件跑跑代码也是好的
话不多说,这就开始~
一、前期准备
数据下载:https://d17h27t6h515a5.cloudfront.net/topher/2016/December/584bcec3_titanic-data/titanic-data.csv
软件准备:python 2.7 (安装 pandas 库) 多嘴说一句,懒得装各种库各种包的童鞋,请直接下载anaconda。
另外推荐jupyter,代码+报告结合神器
pandas --- 用过的人都说好用,没用过的小伙伴赶紧开始尝试吧~~
二、分析开始
1、导入数据&查看基本信息