python将句子按固定长度拆分且保持句子完整

实现对任一长度的文本段进行拆分,保证每段文本长度<=n,返回格式为列表。
alltext:需要切分的文本段。
n:句子最大长度。

import re
def splitkeywords(text,n=50):
    res = []
    b = 0
    ssum = ''
    t = ''
    sentence = re.split([,。],text)
    for s in range(len(sentence)):
        i = sentence[s]
        if len(i) >= n:
            if s == 0:
                res.append(i)
            else:
                res.append(ssum)
                res.append(i)
            b = 0
            ssum = ''
            t = ''
        else:
            b += len(i)
            t += '、'+i
            if b > n:
                res.append(ssum)
                b = len(i)
                ssum = i
                t = ssum
            elif b == n:
                res.append(t)
                b = 0
                ssum = ''
                t = ''
            else:
                ssum = t
            if s == len(sentence) - 1 and t != '':
                res.append(t)
    return res
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值