Pandas数据分析⑦——数据分析实例2（泰坦尼克号生存率分析）

最新推荐文章于 2024-04-03 17:49:28 发布

置顶

数据小斑马

最新推荐文章于 2024-04-03 17:49:28 发布

阅读量6.6k

点赞数 13

分类专栏： Pandas 文章标签： pandas 数据分析实例 python 数据分析案例泰坦尼克号存活率分析 pandas数据分析数据分析案例

本文链接：https://blog.csdn.net/cindy407/article/details/91387707

版权

公众号: 数据小斑马,关注即可获得价值1000元的数据分析学习资料

Pandas系列目录（文末有超大惊喜）：
Pandas数据分析①——数据读取（CSV/TXT/JSON)
Pandas数据分析②——数据清洗（重复值/缺失值/异常值）
Pandas数据分析③——数据规整1（索引和列名调整/数据内容调整/排序）
Pandas数据分析④——数据规整2（数据拼接/透视)
Pandas数据分析⑤——数据分组与函数使用（Groupby/Agg/Apply/mean/sum/count)
Pandas数据分析⑥——数据分析实例（货品送达率与合格率/返修率/拒收率）

Kaggle竞赛的“泰坦尼克号预测生还”是进行Pandas数据分析非常好的案例，虽然CSDN有很多大神已经做了非常高深的机器学习的建模研究，但是我还是想从一个比较基础的提升Pandas使用角度来做一篇总结~
今天主要想了解的有：
1、不同性别、舱位和年龄的分布情况
2、不同性别、舱位和登录港口的获救比例比较，找到生还比例更高的特征有哪些

一、数据清洗

公众号: 数据小斑马,关注即可获得价值1000元的数据分析学习资料

①筛选列

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = pd.read_csv('train.csv')
print(data.info())

在这里插入图片描述
先看看各个特征代表的是什么意思：

PassengerId => 乘客ID，这个不会影响到存活，可删除
Pclass => 乘客等级(1/2/3等舱位)
Name => 乘客姓名，不会影响，可删除
Sex => 性别
Age => 年龄
SibSp => 堂兄弟/妹个数
Parch => 父母与小孩个数
Ticket => 船票信息，不会影响，可删除
Fare => 票价
Cabin => 客舱，不会影响，可删除

最低0.47元/天解锁文章

数据小斑马

关注

13
点赞
踩
81

收藏

觉得还不错? 一键收藏
6
评论
Pandas数据分析⑦——数据分析实例2（泰坦尼克号生存率分析）

Kaggle竞赛的“泰坦尼克号预测生还”是进行Pandas数据分析非常好的案例，虽然CSDN有很多大神已经做了非常高深的机器学习的建模研究，但是我还是想从一个比较基础的提升Pandas使用角度来做一篇总结~今天主要想了解的有：1、不同性别、舱位和年龄的分布情况2、不同性别、舱位和登录港口的获救比例比较，找到生还比例更高的特征有哪些一、数据清洗①筛选列import pandas as p...
复制链接

扫一扫