1、根据标点符号对一段话进行分句
# 句子切分规则函数
import re
def cut_sentences(content):
# 指定切分标点
pattern=r'\。|\!'
sentences = re.split(pattern, content)
return sentences
# 输入内容
content = input("输入需要切分的正文:")
# 调用句子切分函数
sents0 = cut_sentences(content)
# 删除最后一个空值(如果存在)
del sents0[-1]
2、根据序号对一段话进行切分
import re
countent = "1、一级标题2、二级标题3、三级标题"
# 切分规则,如果是其他序号,在[]中按顺序修改就好
sentence_list = re.split(u"[\d][、]", countent)
new_list = list(filter(None, sentence_list))
输出:['一级标题', '二级标题', '三级标题']