文章目录
Pandas 为 文本处理提供了 str 属性,通过该属性可以自动跳过缺失/NA 值对每个元素进行操作。
使用str 属性时需注意一下几点:
- 只有Series数据结构才能使用str 属性。
- 访问的对象是字符类型。
- 一个语句可以使用多个该属性。
series.str.lower().str.title()
1、文本格式
转为小写字母:Series.str.lower()
转为大写字母:Series.str.upper()
转为标题:Series.str.title()
将每个单词的首字母转为大写
首字母大写:Series.str.ccapitalize()
大小写互换:Series.str.swapcase()
转为小写字母(支持其他语言):Series.str.casefold()
2、对齐方式
Series.str.center(10,fillchar='一') #居中对齐,宽度为10,用“一”填充
Series.str.ljust(10,fillchar='一') #左对齐
Series.str.rjust(10,fillchar='一') #右对齐
Series.str.ljust(width=10,size='left',fillchar='一') #指定宽度,填充内容对齐方式,填充内容
Series.str.zfill(3) # 填充对齐,不足3位的前面加0
3、字符拆分
(1)split()方法
Series.str.split() #
Series.str.split('-').get(1) / Series.str.split('-').str[1] # 读取切分后的字符
Series.str.split('-',expand=True) # 将返回的列表展开
Series.str.split('-',expand=True,n=1) # 限制切分次数
Series.str.rplit('-',expand=True,n=1) # 从字符串尾部向首部切分
(2)slice切片
Series.str.slice(1) #切掉第一个字符,留下剩余字符
Series