python常用操作之使用多个界定符(分隔符)分割字符串

本系列文章会总结python中各种常见及常用的内置方法、对不同数据结构的操作,参考书籍《python cookbook》第三版


  • 在日常学习及工作中,不论是在解析数据还是在产出输出,使用python最多的就是常用的基本数据结构如:字符串、列表、字典、元组等等等
  • 各种操作无非就是:将某种数据结构通过自定义的方法、内置方法转换成另一种数据结构,当我们熟悉python内置方法后,操作会更加简便

单个界定符分割字符串

  • string对象的 split() 方法只适应于非常简单的字符串分割情形,它并不允许有
    多个分隔符或者是分隔符周围不确定的空格

代码演示

line = 'abc,def,ghi,jkl,mno'
line.split(',')

在这里插入图片描述

  • .split()方法只适合一个界定符分割简单字符串的情况

多个界定符分割字符串

  • 函数re.split() 允许你为分隔符指定多个正则匹配模式,来达到使用多个界定符分割字符串的目的

代码演示

import re

line1 = 'abc, def; ghi, jkl;mno'
re.split(r'[;,\s]\s*', line1)

在这里插入图片描述

  • 在上面的例子中,分隔符可以是逗号,分号;或者是空格,并且后面紧跟着任意个的空格。只要这个模式被找到,那么匹配的分隔符两边的实体都会被当成是结果中的元素返回。返回结果为一个字段列表,这个跟 str.split() 返回值类型是一样的

注意

  • 当你在使用re.split()函数时候,需要特别注意的是正则表达式中是否包含一个括号捕获分组。如果使用了捕获分组,那么被匹配的文本也将出现在结果列表中。比如,观察一下下述代码运行后的结果:
re.split(r'(;|,|\s)\s*', line)

在这里插入图片描述

  • 如果你不想保留分割字符串到结果列表中去,但仍然需要使用到括号来分组正则表
    达式的话,确保你的分组是非捕获分组,形如 (?:…) 。比如:
re.split(r'(?:;|,|\s)\s*', line)

在这里插入图片描述

总结

  • 当你只是简单的对字符串根据一个固定的分割符进行分割时,使用str.split()函数即可
  • 当你不确定分割字符串时,使用re.split()函数是非常方便的,不管是[]正则匹配模式,还是()分组正则表达式都是可以的
  • 值得注意的是如果使用()分组且数据结果中不需要保留分割字符串时,需要添加(?:…) ?:这样的前缀即可
  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值