pandas学习笔记

最新推荐文章于 2022-08-21 22:22:37 发布

iostreamzl

最新推荐文章于 2022-08-21 22:22:37 发布

阅读量461

点赞数

分类专栏：机器学习 pandas系列文章标签： python 机器学习大数据 pandas 经验分享

本文链接：https://blog.csdn.net/weixin_43776305/article/details/115435422

版权

这篇博客详细介绍了Pandas库的使用，包括Series的创建、索引、切片和运算，DataFrame的创建及索引方法。强调了对列和行的正确索引方式，指出不推荐使用链式索引。此外，还讨论了如何处理缺失值，如使用isnull和notnull配合any和all方法，并介绍了元素替换的操作，如replace方法的使用。

摘要由CSDN通过智能技术生成

安装

pip install pandas

导入包

import pandas as pd

Series基本操作
可以通过列表，ndarray，字典创建series

# 通过列表创建series，传递的是副本，修改series不会影响列表元素
# 不传递index参数，默认index为0-len(l)
# 通过name参数可以为Series命名，默认为None
l = [1, 2, 3, 4]
s = pd.Series(l)

# 通过ndarray来创建series，传递的是引用，修改series值会影响ndarray的值
arr = np.random.randint(0, 100, size=10)
s2 = pd.Series(arr)

# 通过字典创建, 字典的key就是series的索引, 传递的也是副本
# 不传递index参数，默认index为0-len(l)
d = {
   "a" : 1, "b" : 2, "c" : 3, "d" : "4", "e": 5}
s = pd.Series(d)

Series索引和切片
显式索引：通过提供的(可以看得见的)索引来索引series
隐式索引：通过整数索引，可想象成下标，隐式索引是无法看见的

s.loc['a'] # 显式推荐写法
s.loc["a":"d"] # 显式索引切片是闭区间
s.iloc[0] # 隐式推荐
s.iloc[0:3] # 切片操作是左闭右开的
# 总结，显示推荐用loc[], 隐式推荐用iloc[], 直接使用[]会存在分不清显示还是隐式的问题

Series运算

运算符	pandas封装函数
+	add()
-	sub() or substract()
*	mul() or multiply()
/	truediv() or div() or divide()
//	floordiv()
%	mod()
**	pow()

s1 = pd.Series(np.random.randint(0, 10, size=3), name="S1")
s2 = pd.Series

最低0.47元/天解锁文章

iostreamzl

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录