re.split()
适用:多个 分隔符,切割功能非常强大
语法: re.split(pattern, string, maxsplit=0)
通过正则表达式将字符串分离。如果用括号将正则表达式括起来,那么匹配的字符串也会被列入到list中返回。maxsplit是分离的次数,maxsplit=1分离一次,默认为0,不限制次数。
例子:
>>> import re
>>> line = 'aa bb cc dd; ee ff. gg- hh ii kk'
>>> line
'aa bb cc dd; ee ff. gg- hh ii kk'
单字符切割:
>>> re.split(';',line)
['aa bb cc dd', ' ee ff. gg- hh ii kk']
两个字符以上切割,放在 [ ] 中(不保留分隔符):
>>> re.split('[;.-]',line)
['aa bb cc dd', ' ee ff', ' gg', ' hh ii kk']
使用 ( ) 捕获分组(保留分割符):
>>> re.split('([;,])',line)
['aa bb cc dd', ';', ' ee ff', '.', ' gg', '-', ' hh ii kk']