【Python自动化Excel】Python与pandas字符串操作

本文介绍了Python和pandas库在处理Excel数据时的字符串操作,包括替换空格、分列、切片、补齐数据、正则表达式以及apply函数的应用。通过实例展示了如何在数据清洗环节中有效地进行字符串处理,提升数据分析效率。
摘要由CSDN通过智能技术生成

Python之所以能够成为流行的数据分析语言,有一部分原因在于其简洁易用的字符串处理能力。

Python的字符串对象封装了很多开箱即用的内置方法,处理单个字符串时十分方便;对于Excel、csv等表格文件中整列的批量字符串操作,pandas库也提供了简洁高效的处理函数,几乎与内置字符串函数一一对应。也就是说:

  • 单个字符串处理,用Python内置的字符串方法;

  • 表格整列的字符串处理,用pandas库中的字符串函数;

本文就以常用的数据处理需求,来对比使用以上两种方式的异同,从而加深对 Python 和 pandas 字符串操作的理解。(本文所有数据都是为了演示用的假数据,切勿当真!)

)

一、替换(去除空格)

场景:在问卷收集的姓名字段中,不少填写者会误输入空格,造成数据匹配不一致的问题。

Python

names = '刘    备、关  羽、   张 飞、赵   云、马 超、黄 忠'
names = names.replace(' ','')
print(names)

output

刘备、关羽、张飞、赵云、马超、黄忠

pandas

df['姓名'] = df['姓名'].str.replace(' ','')

output

pandas替换空格

二、分列

场景:在问卷收集数据的时候,多选题的数据往往是带有分隔符的。在分类汇总前往往需要按分隔符进行分列。

问卷中多选数据导出

Python

hobbyStr = "足球┋排球┋羽毛球┋篮球"
hobbyList = hobby
  • 9
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值