【稳住,can win】Pandas 操作数据

这篇博客介绍了如何使用Pandas创建Series和DataFrame对象,包括从字典和列表创建数据结构。还讲解了如何通过列名进行数据索引,以及如何利用布尔索引筛选数据。此外,讨论了处理缺失数据的方法,如使用isnull()检查并选择数据,以及填充或删除nan值的策略。
摘要由CSDN通过智能技术生成

Pandas 对象的创建

Series 一维数据

t1 = pd.Series(np.arange(0, 10, 2), index=list("abcde"))

# 先创建一个字典再用Series创建一个Pandas对象
t2 = {"name":"xiaohong", "age":30, "tel":10086} 
t2 = pd.Series(t2)

DataFrame 二维数据

t4 = {"name":["xiaoming", "xiaohong"], "age":[18, 20], "tel":[10088, 10089]}
t4 = pd.DataFrame(t4)
# 一个字典表示一条数据
t5 = [{"name":"xiaoming", "age":18, "tel":10088}, {"name":"xiaohong", "age":20, "tel":10089}]
t5 = pd.DataFrame(t5)

DataFrame 对象索引

通过列名可以获取所有数据的某一属性。如下代码实现的是读取所有数据的Actors属性。

file_path = "DataAnalysis/IMDB-Movie-Data.csv"
df = pd.read_csv(file_path)
print(df["Actors"])

在这里插入图片描述
bool索引同样在Pandas中也可以使用。

print(df[df["Row_Labels"].str.len()>4].head(10))

在这里插入图片描述

处理缺失数据

通过Pandas的isnull可以判断数据是否为nan。
在这里插入图片描述
对于nan数据,要么删除,要么填充为合适的数据。

在这里插入图片描述
上图将nan填充为同一列每行的均值。删除nan的时候,制定how=any,一条数据只要有一个nan就删除。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Schuyler Hu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值