本期,我们暂时不读取excel表格了,直接操作Series或者DataFrame。因为以下函数都可以应用,而且会非常简单,如下所示:
>>> df = pd.read_excel(r'D:/myExcel/1.xlsx')
>>> df
name math
0 bog 45
1 jiken 67
2 bob 23
3 jiken 34
# 该列全部大写
>>> df['name'] = df['name'].str.upper()
>>> df
name math
0 BOG 45
1 JIKEN 67
2 BOB 23
3 JIKEN 34
1、upper()以及lower()函数
顾名思义,这两个函数一个是转化为大写,一个是转换为小写。
>>> import numpy as np
>>> s = pd.Series(['A', 'B', 'C', 'Aaba', 'Baca', np.nan, 'CABA', 'dog', 'cat'])
>>> s.str.lower()
0 a
1 b
2 c
3 aaba
4 baca
5 NaN
6 caba
7 dog
8 cat
dtype: object
>>> s.str.upper()
0 A
1 B
2 C
3 AABA
4 BACA
5 NaN
6 CABA
7 DOG
8 CAT
dtype: object
2、len()函数
该函数的主要作用是返回字符的长度
>>> s.str.len()
0 1.0
1 1.0
2 1.0
3 4.0
4 4.0
5 NaN
6 4.0
7 3.0
8 3.0
dtype: float64
3、strip()
该函数的主要作用是删掉字符左右两面的空白,lstrip()删除字符左边的空白,rstrip()删除字符右边的空白
>>> idx = pd.Index([' jack', 'jill ', ' jesse ', 'frank', 'frank li' ])
>>> idx.str.strip()
Index(['jack', 'jill', 'jesse', 'frank', 'frank li'], dtype='object')
>>> index.str.lstrip()
>>> idx.str.lstrip()
Index(['jack', 'jill ', 'jesse ', 'frank', 'frank li'], dtype='object')
>>> idx.str.rstrip()
Index([' jack', 'jill', ' jesse', 'frank', 'frank li'], dtype='object')
哈哈,以上就是python小工具关于这几个字符方法在pandas中的应用,有兴趣的话欢迎关注: python小工具,学习pandas和python。本文出自pandas文档中的user guide目录下的working with text data部分,欢迎通过公众号获取官方文档并学习pandas。