[ Pandas version: 1.0.1 ]
十、向量化字符串操作
Pandas提供一系列向量化字符串操作(vectorized string operation)是在处理(清洗)现实工作中的数据时不可或缺的功能。
Pandas字符串方法列表
1. 与Python字符串方法相似的方法
返回字符串Series[Series or Index of object]:
方法 | 参数 | 描述 |
---|---|---|
lower() |
NA | 全部小写 |
upper() |
NA | 全部大写 |
capitalize() |
NA | 首字母大写 |
swapcase() |
NA | 大小写互换 |
ljust() |
width[int], fillchar=’ '[str] |
返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。 如果指定的长度小于原字符串的长度则返回原字符串 |
rjust() |
width, fillchar=’ ’ |
返回一个原字符串右对齐,并使用空格填充至指定长度的新字符串。 如果指定的长度小于原字符串的长度则返回原字符串 |
center() |
width, fillchar=’ ’ |
返回一个原字符串居中,并使用空格填充至长度width的新字符串 |
zfill() |
width[int] | 返回指定长度的字符串,原字符串右对齐,前面填充0 |
index() |
sub[str], start=0[int-index], end=None[index] |
查找给定字符串的位置,注意,如果不存在这个字符串,那么会报错 |
rindex() |
sub[str], start=0[int-index], end=None[index] |
从右边开始查找,给定字符串的位置 |
strip() |
to_strip=None[str or None] | 去除两边的空白字符 |
rstrip() |
to_strip=None[str or None] | 去除右边的空白字符 |
lstrip() |
to_strip=None[str or None] | 去除左边的空白字符 |
返回布尔值[Series or Index of bool]:
方法 | 参数 | 描述 |
---|---|---|
islower() |
NA | 是否全部小写 |
isupper() |
NA | 是否全部大写 |
isspace() |
NA | 是否全部是空格 |
istitle() |
NA | 是否首字母大写 |
isnumeric() |
NA | 是否全部是数字 |
isdigit() |
NA | 是否全部都是数字并至少有一个字符 |
isdecimal() |
NA | 检查字符串是否只包含十进制字符 |
isalpha() |
NA | 是否全部是字母 |
isalnum() |
NA | 是否全部是数字和字母组成 |
startswith() |
pat[str], na=nan[object] |
判断是否以给定的字符串开头 |
endswith() |
pat[str], na=nan[object] |
判断是否以给定的字符串结束 |
返回数值[Series or Index of int]: