pandas学习笔记

这篇博客详细介绍了Pandas库的使用,包括Series的创建、索引、切片和运算,DataFrame的创建及索引方法。强调了对列和行的正确索引方式,指出不推荐使用链式索引。此外,还讨论了如何处理缺失值,如使用isnull和notnull配合any和all方法,并介绍了元素替换的操作,如replace方法的使用。
摘要由CSDN通过智能技术生成

安装

pip install pandas

导入包

import pandas as pd

Series基本操作
可以通过列表,ndarray,字典创建series

# 通过列表创建series,传递的是副本,修改series不会影响列表元素
# 不传递index参数,默认index为0-len(l)
# 通过name参数可以为Series命名,默认为None
l = [1, 2, 3, 4]
s = pd.Series(l)

# 通过ndarray来创建series,传递的是引用,修改series值会影响ndarray的值
arr = np.random.randint(0, 100, size=10)
s2 = pd.Series(arr)

# 通过字典创建, 字典的key就是series的索引, 传递的也是副本
# 不传递index参数,默认index为0-len(l)
d = {
   "a" : 1, "b" : 2, "c" : 3, "d" : "4", "e": 5}
s = pd.Series(d)

Series索引和切片
显式索引:通过提供的(可以看得见的)索引来索引series
隐式索引:通过整数索引,可想象成下标,隐式索引是无法看见的

s.loc['a'] # 显式推荐写法
s.loc["a":"d"] # 显式索引切片是闭区间
s.iloc[0] # 隐式推荐
s.iloc[0:3] # 切片操作是左闭右开的
# 总结,显示推荐用loc[], 隐式推荐用iloc[], 直接使用[]会存在分不清显示还是隐式的问题

Series运算

运算符 pandas封装函数
+ add()
- sub() or substract()
* mul() or multiply()
/ truediv() or div() or divide()
// floordiv()
% mod()
** pow()
s1 = pd.Series(np.random.randint(0, 10, size=3), name="S1")
s2 = pd.Series
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值