【pandas】结合泰坦尼克生还分析讲讲pandas常用基础操作

本文通过泰坦尼克号数据集,介绍pandas的基础操作,包括数据读取、缺失值处理、数据映射、筛选查找、排序、数据透视等,并结合船舱等级、性别和年龄分析生还率。
摘要由CSDN通过智能技术生成


本文旨在结合经典案例:泰坦尼克号数据集,介绍pandas的基础操作,力求简洁清晰,可以作为一个教程,也可以作为一个速查表,欢迎多多收藏点赞~

泰坦尼克号数据集是一个非常经典的数据集,它记录了泰坦尼克号的乘客信息,包括年龄、性别、是否存活等等。
我们可以用pandas来对其进行分析,一步一步揭开数据里的秘密,探索泰坦尼克号生还者们背后的真相

1.导入库

首先,我们要把我们的工具:pandas,从工具箱里拿出来

import pandas as pd

2.数据读取

pandas是一个处理数据的全能型工具箱,你能想到的任何数据处理的操作,它都能做
然后用pandas取出我们要加工的对象:数据集。

data = pd.read_csv("Titanic.csv") 

3.基本信息查看

查看数据有哪些字段:

# 查看数据有哪些字段
data.columns

# 描述性统计分析
data.describe()

# 展示前3行数据
data.head(3)

4.获取列

# 获取单列
data.Name
# 获取多列
data[["Name","Age"]]

5.缺失值处理

有时候数据并不不完整,存在一些缺失,这时候可以对缺失值进行一些填充

# 查看各列缺失值个数
data.isnull().sum()

# 指
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值