1.当使用series作为处理对象时,注意需要调用内置函数str
2.当使用dataframe作为处理对象时,把单独的列提取再处理,也调用str
3.处理时自动忽略缺失值数据(NaN)
import pandas as pd
import numpy as np
df = pd.DataFrame(['C', 'Python', np.nan, '1125','java'],columns=['col1'],index=['a1','a2','a3','a4','a5'])
print(df['col1'].str.lower())
s = pd.Series(['C', 'Python', 'java', 'go', np.nan, '1125','javascript'])
print(s.str.lower())
使用的函数:
1.转换大小类:(1)lower():转为小写;(2)upper():转为大写;(3)swapcase():交换大小写
2.检查返回布尔值类:(1)islower():是否全是小写;(2)issupper():是否全为大写;(3)isnumeric():是否全为数字;(4)startswith(pattern):是否以指定字符串开头;(5)endswith(pattern):是否以指定字符串结尾;(6)contains(pattern):字符串是否包含指定子串
3.操作类:(1)strip():去除字符串左右空格;(2)split(" "):指定分隔符切割字符串;(3)findall(pattern):以列表[]形式返回字符串;(4)find(pattern):返回字符串第一次出现索引的位置;(5)repeat(value):以指定次数重复每个元素