安装
pip install pandas
导入包
import pandas as pd
Series基本操作
可以通过列表,ndarray,字典创建series
# 通过列表创建series,传递的是副本,修改series不会影响列表元素
# 不传递index参数,默认index为0-len(l)
# 通过name参数可以为Series命名,默认为None
l = [1, 2, 3, 4]
s = pd.Series(l)
# 通过ndarray来创建series,传递的是引用,修改series值会影响ndarray的值
arr = np.random.randint(0, 100, size=10)
s2 = pd.Series(arr)
# 通过字典创建, 字典的key就是series的索引, 传递的也是副本
# 不传递index参数,默认index为0-len(l)
d = {
"a" : 1, "b" : 2, "c" : 3, "d" : "4", "e": 5}
s = pd.Series(d)
Series索引和切片
显式索引:通过提供的(可以看得见的)索引来索引series
隐式索引:通过整数索引,可想象成下标,隐式索引是无法看见的
s.loc['a'] # 显式推荐写法
s.loc["a":"d"] # 显式索引切片是闭区间
s.iloc[0] # 隐式推荐
s.iloc[0:3] # 切片操作是左闭右开的
# 总结,显示推荐用loc[], 隐式推荐用iloc[], 直接使用[]会存在分不清显示还是隐式的问题
Series运算
运算符 | pandas封装函数 |
---|---|
+ | add() |
- | sub() or substract() |
* | mul() or multiply() |
/ | truediv() or div() or divide() |
// | floordiv() |
% | mod() |
** | pow() |
s1 = pd.Series(np.random.randint(0, 10, size=3), name="S1")
s2 = pd.Series