全网没有之一的【Python自动化Excel】Python与pandas字符串操作

​​​​​​Python之所以能够成为流行的数据分析语言,有一部分原因在于其简洁易用的字符串处理能力。

Python的字符串对象封装了很多开箱即用的内置方法,处理单个字符串时十分方便;对于Excel、csv等表格文件中整列的批量字符串操作,pandas库也提供了简洁高效的处理函数,几乎与内置字符串函数一一对应。也就是说:

点我免费领取全套软件测试(自动化测试)视频资料(备注“csdn000”)

  • 单个字符串处理,用Python内置的字符串方法;

  • 表格整列的字符串处理,用pandas库中的字符串函数;

本文就以常用的数据处理需求,来对比使用以上两种方式的异同,从而加深对Pythonpandas字符串操作的理解。(本文所有数据都是为了演示用的假数据,切勿当真!)

)

一、替换(去除空格)

场景:在问卷收集的姓名字段中,不少填写者会误输入空格,造成数据匹配不一致的问题。

Python#

names = '刘    备、关  羽、   张 飞、赵   云、马 超、黄 忠'
names = names.replace(' ','')
print(names)

output

刘备、关羽、张飞、赵云、马超、黄忠

pandas#

df['姓名'] = df['姓名'].str.replace(' ','')

output

pandas替换空格

二、分列

场景:在问卷收集数据的时候,多选题的数据往往是带有分隔符的。在分类汇总前往往需要按分隔符进行分列。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值