在使用split函数时,有时需要多个分隔符使用:
sentences = re.split(r"。|\n|\?|?|!|!|……",content)
sentence = list(filter(lambda x: x != '', sentences)) # 去除split引入的 ' '
或者
按作者提供的方案:
去除list中的空格元素
为什么引入了一个空格,是因为每一个分隔符都被空格替换,如果连续出现两个符号,就会导致出现一个多余的空格元素
在使用split函数时,有时需要多个分隔符使用:
sentences = re.split(r"。|\n|\?|?|!|!|……",content)
sentence = list(filter(lambda x: x != '', sentences)) # 去除split引入的 ' '
或者
按作者提供的方案:
去除list中的空格元素
为什么引入了一个空格,是因为每一个分隔符都被空格替换,如果连续出现两个符号,就会导致出现一个多余的空格元素