python字符串与文本处理技巧(1):分割、首尾匹配、模式搜索、匹配替换

本文介绍了Python字符串处理的四个关键技巧:1) 使用str.split()和re.split()进行灵活的字符串分割;2) 利用str.startswith()和str.endswith()检查字符串首尾匹配;3) 结合str.find()和re.match()进行字符串匹配与搜索;4) 使用str.replace()和re.sub()实现字符串的搜索替换。这些技巧在处理文本数据时非常实用。
摘要由CSDN通过智能技术生成

1. 字符串分割

将一个字符串分割为多个字段,但是分隔符(还有周围的空格)并不是固定的。

  • str.split() 和 re.split()

string 对象的 split() 方法只适应于非常简单的字符串分割情形, 它不允许有多个分隔符或者是分隔符周围不确定的空格。 当需要更加灵活的切割字符串的时候,应该使用 re.split()方法:

import re

line = 'asdf fjdk; afed, fjek,asdf, foo'
print(re.split(r'[;,]', line))
# >>> ['asdf fjdk', ' afed', ' fjek', 'asdf', ' foo']
print(re.split(r'[;,\s]', line))
# >>> ['asdf', 'fjdk', '', 'afed', '', 'fjek', 'asdf', '', 'foo']
print(re.split(r'[;,\s]\s', line))
# >>> ['asdf fjdk', 'afed', 'fjek,asdf', 'foo']
print(re.split(r'[;,\s]\s*', line)) # \s* 表示连续的空格
# >>> ['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

函数 re.split() 是非常实用的,因为它允许为分隔符指定多个正则模式。 比如,在上面的例子中,分隔符可以是逗号,分号或者是空格,并且后面紧跟着任意个的空格。 只要这个模式被找到,那么匹配的分隔符两边的实体都会被当成是结果中的元素返回。 返回结果为一个字段列表,这个跟 str.split() 返回值类型是一样的。

2. 字符串首尾匹配

当我们需要通过指定的文本模式去检查字符串的开头或者结尾,比如文件名后缀

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值