利用了re模块。
例子:只去除句子中的空格;保留标点符号,并且与单词分开。
In [44]: s = re.split('([,.])', "apple a day, keep dr away.") # 注意第一项参数有()
In [45]: s
Out[45]: ['apple a day', ',', ' keep dr away', '.', '']
In [46]: x = []
In [47]: for si in s:
...: x.extend(si.split())
...:
In [48]: x
Out[48]: ['apple', 'a', 'day', ',', 'keep', 'dr', 'away', '.']