7、Python如何拆分含有多种分隔符的字符串

我们要把某个字符串拆分为列表,但是分隔符有多个,如下所示,逗号 、分号 、竖线 以及和号都是分隔符,如何处理?

str = 'ab|cdef;ghig,klm;nopq&rstu,vwx|yz'

方案一:使用 str.split() 方法,循环处理每一种分隔符

def my_split(str, seps):
    res = [str]
    for sep in seps:
        t = []
        list(map(lambda ss: t.extend(ss.split(sep)), res))
        res = t
    print(res)

extend()是列表(list)类型的一个内置方法,用于将一个列表(或任何可迭代的元素)添加到当前列表的末尾。这里借助了这个方法把分割结果转为一维。

这里拓展一种思路,就是 sum 函数,除了数字求和,也可以计算列表相加使用。起始值传入 []。

基础语法:sum(iterable, start=0)

其中,iterable表示需要进行求和操作的序列;start表示起始值,如果没有传入该参数,则默认为0。

def my_split(str, seps):
    res = [str]
    for sep in seps:
        res = sum([s.split(sep) for s in res], [])
    print(res)

方案二:使用 reduce 函数对结果集进行累计处理

重新梳理上面得思路,就是每次对字符串进行 split ,然后把结果循环,再用一个新的分隔符进行分隔,再把结果处理成一维的,再用循环结果用新的分隔符处理。这就是 reduce 函数。

from functools import reduce
res = reduce(lambda l, sep: sum([s.split(sep) for s in l], []), '|,;&', [str])
print(res)
# 也可以封装成一个函数
my_split = lambda s, seps: reduce(lambda l, sep: sum([s.split(sep) for s in l], []), seps, [s])
res = my_split(str, '|,;&')
print(res)

上面这种方式,就把整个处理过程,做成了一行,只能感叹 reduce 的强大。

但是这种代码,学习一下就够了,日常工作中不要这么写,别人去理解你这一串代码是需要时间的,不利于代码的可读性,当然别人如果这么写,我们要能看懂,这就够了。

方案二:使用正则的 split 方法,推荐使用

基本语法如下:

re.split(pattern, string, maxsplit=0, flags=0)
  • pattern:正则表达式的模式或模式字符串。
  • string:要被分割的字符串。
  • maxsplit:可选参数,指定最大分割次数,默认为0,表示不限制分割次数。
  • flags:可选参数,用于控制正则表达式的匹配方式,如是否区分大小写等。

可以看到,使用正则表达式的split,可以在正则中使用加号 + ,一次性传多个分隔符进行处理。

import re
res = re.split('[|,;&]+', str)
print(res)

可以看到,这个方法是非常简洁,并且容易理解,可读性更强。推荐使用。

当然,如果是分隔符只有一个,还是要使用 str.split 进行处理,比正则的效率更高。

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值