解决问题
对于长串的字符串,通常需要按照某个字符进行拆分。通常有两种方法,一种str.split(),自带的split函数,这种方法的局限在于只能定义一个分隔符,以及对于分割符周围的不确定空格无能为力;另一种正则模块的re.split(patterns,str),这种方法可以弥补以上局限。
str.split()
对于字符串:
tem='abs/efc/str'
str.split()根据’/'分割,返回列表:
tem.split('/')
返回:
['abs', 'efc', 'str']
re.split(patterns,str)
对于存在多个分割符的字符串tem,导入正则模块:
import re
tem = 'asdf fjdk; afed, fjek,asdf, foo'
如果不返回分割符,分隔符写在[]里面,分隔符之间没有分隔:
re.split(r'[\s,;]\s*',tem)
#结果
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
如果想和分隔符一起返回,分隔符写在()里面,分隔符之间用 | 隔开:
re.split(r'(\s|,|;)\s*',tem)
#结果
['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']
你也可以使用(?: …)达到和[]一样的效果,也就是说一下两种写法结果是一样的:
re.split(r'[\s,;]\s*',tem)
re.split(r'(?:\s|,|;)\s*',tem)
#结果都是
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
以上。