感想
pandas常用文本操作函数有九种。
①、字母型函数:upper, lower, title, capitalize, swapcase
②、数值型函数:pd.to_numeric
③、统计型函数:count 和 len
④、格式型函数:strip, rstrip, lstrip,pad, rjust, ljust, center,zfill
⑤、替换型函数:replace
⑥、拆分型函数:split
⑦、合并型函数: join 和 cat
⑧、匹配型函数:contains 、startswith 、 endswith、match
⑨、提取型函数:extractall、extract
在此主要介绍几个格式型函数。
1、pad 是最灵活的,它可以选定字符串长度、填充的方向和填充内容。
如下:
ab=pd.DataFrame({'NO':[1,2,3,4,5,6,7],'name':['a','b','c','d','e','f','g']})
# 若把NO列改成此形式:#0000001
ab['NO']=ab['NO'].astype(str)
ab['NO']=ab['NO'].str.pad(7,'left','0').str.pad(8,'left','#')
2、zfill 是自动在不满足长度位置填充0。
ab=pd.DataFrame({'NO':[1,2,3,4,5,6,7],'name':['a','b','c','d','e','f','g']})
# 若把NO列改成此形式:0000001
ab['NO']=ab['NO'].astype(str)
ab['NO']=ab['NO'].str.zfill(7)
参考资料:https://datawhalechina.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch8.html