python 相邻字符串分割_python字符串分割

内置split()函数 str.split(sep=None, maxsplit=-1)

sep为自定义分割符,maxsplit为最大分割次数,默认值-1进行全部分割

注意以下区别:

str.split() 以空格分割,包括连续空格

str.split(' ') 同样以空格分割,但是不能识别连续空格,会返回两空格之间的空字符串

python3 doc

re模块的split()函数 re.split(pattern, string, maxsplit=0, flags=0)

pattern分割模式

正则表达式描述pattern

官方文档中举例以下几种:

r'\W+' 非单词字符的字符作为分割符

r'(\W+)' 以括号包裹正则表达式则会在结果中保留用来分割的字符

'[a-f]+' a-f组成的字符串作为分割符

输入

print(re.split(r'\W+','Words, words, word.'))

print(re.split(r'\W+','Words,,words,word.'))

print(re.split(r'[a-f]+','a3b4gf',flags = re.IGNORECASE))

输出

['Words', 'words', 'word', '']

['Words', ',,', 'words', ',', 'word', '.', '']

['', '3', '4g', '']

其他参数

maxsplit和内置的split函数一样,只不过以0作为缺省值

flags:用来修改pattern表达式的功能re.IGNORECASE忽略大小写 其他的可用值👉更多

记录一个奇怪的现象:

print(re.split(r'[a-f]+','a3b4gf',flags = re.IGNORECASE))

print(re.split(r'[a-f]+','a3b4gf',re.IGNORECASE))

输出

['', '3', '4g', '']

['', '3', '4gf']

传入参数包括"flags = "和不包括时,结果不同,原因不太清楚。此外这个测试用例表明分割符前后的内容都会包含在结果中,所以输出开头就有一个空字符串,这一点很古怪。

去除连续分割符之间的空字符串

以上两个函数的简单实用经常在结果中产生空字符串,解决办法解决如下,使用re.split()。

使用列表推导式

[x for x in re.split(r'[,\s]',str) if x] 逗号、空格分割字符串并且去除连续的分割符

使用正则表达式

sList = re.split(r"[,\s]+",s.strip())

使用多字符字符分割时,用'+'修饰就能过滤重复分割符了。

输入1:3 4, 7 3 输出:['3', '4', '7', '3']

输入2:4,, 5 输出:['4', '5']

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值