Pandas学习记录

本文介绍了Pandas库的基础知识,包括Series和DataFrame数据结构。讲解了CSV和JSON文件的读写操作,特别是数据清洗的重点,如空值检测与处理,以及使用mean、median、mode等统计方法填充缺失值。此外,还涵盖了数据格式控制和重复数据的清洗方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 Pandas介绍

在这里插入图片描述

2 数据结构

2.1Series

在这里插入图片描述
在这里插入图片描述

2.2 DataFrame

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4 CSV 文件格式 数据操作

在这里插入图片描述

df.head(x)
df.tail(x)
df.info()
df.to_string()
len(df)

在这里插入图片描述

4 Json文件格式 数据操作

4.1 读JSON文件

在这里插入图片描述

4.2 DataFrame形式读取

在这里插入图片描述

4.3其他形式读取

菜鸟教程pandas教学

5.数据清洗 重点

5.1 数据准备

在这里插入图片描述

5.2 数据获取

在这里插入图片描述

5.3 判断空值数据 isnull()

在这里插入图片描述

5.4 数据清洗

5.4.1 删除有空值的行

在这里插入图片描述
在这里插入图片描述

这里在读数据时候,设置里空值包括(n/a,na,–)

5.4.2 删除指定列有空值的行

在这里插入图片描述

5.5 数据填充

5.5.1 整个表格统一填充

在这里插入图片描述

5.5.2 指定列填充

在这里插入图片描述

5.5.3 使用mean,median,mode进行数据填充

mean 平均值 指定列填充
在这里插入图片描述
median 中位数 指定列填充
在这里插入图片描述
mode 众数 指定列填充
在这里插入图片描述

6 数据格式控制

6.1 格式转化

在这里插入图片描述

6.2 格式错误清洗

在这里插入图片描述

6.3 重复数据清洗

在这里插入图片描述

在这里插入图片描述

以上所有学习内容为菜鸟教程内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Philo`

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值