python 分割字符串 str 自主设置长度 然后每句话的长度可以设置,可以设置为 分割500字以内 不用担心分割的太碎

文章提供了一段Python代码,用于解决在按句号或逗号分割文本后可能导致的碎片化问题。代码通过计算每个片段的长度,确保组合后的长度不超过500个字符,以优化后续的批量翻译过程,减少因分割过多而增加的等待时间。
摘要由CSDN通过智能技术生成

这里写自定义目录标题

解决问题

1 分割文本的时候,有时候难免分割的特别碎,比如按照句号分割,或者逗号分割,希望,分割后重新组合起来。
2 我是为了解决后续批量翻译的时候,如果太碎加上sleep的时间,等待的就太长了。

代码

import re
#先按照句号来分割
cc= re.split('。',data)
print(cc)
#依靠数字要求来分割字符
def relayNumberSplit(cc):
    data =list()
    trasdata=''
    needlong = 0
    for i in cc:
        #ilong是得到i的长度,方便后面加减
        #needlong是我想要的长度
        ilong=len(i)
        needlong += ilong
        
        print('ilong',ilong,'needlong ',needlong )
        if needlong <500:
	        #再把句号加回去,我之所以不适用join链接,是因为使用join会突然重复链接,不知道					 
	        #为什么,所以选择了这样一个链接方式
            trasdata = trasdata+i+'.'
            print('trasdata',len(trasdata))

        else:
            #如果大于500了,就先把这句分割好储存起来,本句话就直接留给下一句中
            if len(trasdata)>0:
                print('满了就添加')
                data.append(trasdata)
            if ilong <500:
                trasdata = i
                needlong =ilong
            else:
                i =i.join('.')
                data.append(i)
                trasdata = ''
                needlong =0
            
    return data
#直接执行就可以了,记住输入必须是列表,里面的元素必须是字符串
out=relayNumberSplit(cc)
#我试过是直接成果的
out[0]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值