#不保留分隔符 \W 表示匹配特殊字符除了_
re.split(r'\W+','hello, world')
['hello','world']
#保留分隔符
re.split(r'(\W+)','hello, world')
# ['hello', ', ', 'world']
假设xiaoshuo.txt为一个英文小说
r=open('xiaoshuo.txt','r').read()
a=re.split(r'\W+',r)
Counter(a)
#不保留分隔符 \W 表示匹配特殊字符除了_
re.split(r'\W+','hello, world')
['hello','world']
#保留分隔符
re.split(r'(\W+)','hello, world')
# ['hello', ', ', 'world']
假设xiaoshuo.txt为一个英文小说
r=open('xiaoshuo.txt','r').read()
a=re.split(r'\W+',r)
Counter(a)