Pandas 中的 str 属性提供了一系列常用的字符串方法,下面总结了一些常用的方法:
字符串拆分和拼接
split(separator, n):将字符串按照指定的分隔符分隔成 n 个部分,默认分隔符为任何空白字符。
join(iterable):用指定的分隔符将序列中的元素拼接成一个字符串。
字符串匹配和查找
contains(sub, case=True, na=False):返回一个布尔型的序列,表示每个字符串是否包含指定的子串。
match(pat, case=True, na=False):返回一个布尔型的序列,表示每个字符串是否以指定的正则表达式匹配。
find(sub, start=0, end=None):返回每个字符串中指定子串的起始位置,如果没有找到,则返回 -1。
字符串替换和删除
replace(old, new, count=-1, regex=False):将字符串中的指定子串替换为新的字符串。
strip([chars]):去除字符串中开头或结尾的指定字符,默认去除任何空白字符。
lstrip([chars]):去除字符串开头的指定字符,默认去除任何空白字符。
rstrip([chars]):去除字符串结尾的指定字符,默认去除任何空白字符。
strip_prefix(prefix):去除字符串开头的指定前缀。
strip_suffix(suffix):去除字符串结尾的指定后缀。
字符串大小写转换
lower():将字符串中所有的字符转换为小写。
upper():将字符串中所有的字符转换为大写。
capitalize():将字符串的首字母转换为大写,其他字母转换为小写。
title():将字符串中所有单词的首字母转换为大写,其他字母转换为小写。
字符串格式化
format(*args, **kwargs):将字符串中的占位符替换为指定的值,支持位置参数和关键字参数。
splitlines([keepends]):将字符串按照换行符拆分成多行,返回一个字符串列表。
除了上述方法之外,还有许多其他的字符串方法,可以根据实际需求选择使用。使用 Pandas 的 str 属性可以方便地对 DataFrame 中的字符串进行处理和分析。