Python对文本进行分句

1、根据标点符号对一段话进行分句

# 句子切分规则函数
import re

def cut_sentences(content):
            # 指定切分标点
            pattern=r'\。|\!'
            sentences = re.split(pattern, content)
            return sentences

# 输入内容
content = input("输入需要切分的正文:")
# 调用句子切分函数
sents0 = cut_sentences(content)
# 删除最后一个空值(如果存在)
del sents0[-1]

2、根据序号对一段话进行切分

import re

countent = "1、一级标题2、二级标题3、三级标题"
# 切分规则,如果是其他序号,在[]中按顺序修改就好
sentence_list = re.split(u"[\d][、]", countent)
new_list = list(filter(None, sentence_list))

输出:['一级标题', '二级标题', '三级标题']
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值