python 4-1 如何拆分含有多种分隔符的字符串re.split()/str.split()

python 4-1 如何拆分含有多种分隔符的字符串
解决方案1:
使用str.split()方法,每次处理一种分隔符号
解决方案2:
使用正则表达式re.split(),一次性拆分字符串

解决方案1:
使用str.split()方法,每次处理一种分隔符号
首先我们看一下通过str.split()如何实现,由于包含了[;,|\t
],split函数只能一次通过一个符号分割
s=’ab;;;;;cd|efg|hi,,jkl|mn\topq;rst,uvw\txyz’

def splitStr(str1,seperateStr):
    res = [str1]
    for splitFlag in seperateStr:
        t = []
        map(lambda x: t.extend(x.split(splitFlag)),res)
        print "res is ",res
        res = t
    return res
myResult = splitStr(s,';,|\t')
print "myResult is ",myResult    
myResult is  ['ab', '', '', '', '', 'cd', 'efg', 'hi', '', 'jkl', 'mn', 'opq', 'rst', 'uvw', 'xyz']

通过上面的结果,发现多了几个”空的,是因为存在几个连续的;,我们可以通过下面列表解析过滤一下

myResult = [x for x in myResult if x]
myResult is  ['ab', 'cd', 'efg', 'hi', 'jkl', 'mn', 'opq', 'rst', 'uvw', 'xyz']

解决方案2:
使用正则表达式re.split(),一次性拆分字符串
re.split()可以跟多个分割符参数,

myResult2 = [x for x in re.split(";|,|\||\t",s) if x ]
print "myResult2 is ",myResult2
myResult2 is  ['ab', 'cd', 'efg', 'hi', 'jkl', 'mn', 'opq', 'rst', 'uvw', 'xyz']
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值