datawhale组队学习 pandas
https://datawhalechina.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch8.html
第八章 文本数据
一、str对象
- str对象的设计意图
str 对象是定义在 Index 或 Series 上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其 str 对象。在Python标准库中也有 str 模块,为了使用上的便利,有许多函数的用法 pandas 照搬了它的设计,例如字母转为大写的操作:
str 对象是定义在 Index :
var = 'abcd'
str.upper(var) # Python内置str模块
Out: 'ABCD'
str 对象是定义在 Series :
s = pd.Series(['abcd', 'efg', 'hi'])
s.str.upper() # pandas中str对象上的upper方法
Out:
0 ABCD
1 EFG
2 HI
dtype: object
- []索引器
var = 'abcd'
var[0]
'a'
var[-1: 0: -2]
'db'
三个参数:格式b = a[i:j:s]
这里的s表示步进,缺省为1.(-1时即翻转读取)
所以a[i:j:1]相当于a[i:j]
当s<0时,i缺省时,默认为-1. j缺省时,默认为-len(a)-1
所以a[::-1]相当于 a[-1:-len(a)-1:-1],也就是从最后一个元素到第一个元素复制一遍。