解决问题
1 分割文本的时候,有时候难免分割的特别碎,比如按照句号分割,或者逗号分割,希望,分割后重新组合起来。
2 我是为了解决后续批量翻译的时候,如果太碎加上sleep的时间,等待的就太长了。
代码
import re
#先按照句号来分割
cc= re.split('。',data)
print(cc)
#依靠数字要求来分割字符
def relayNumberSplit(cc):
data =list()
trasdata=''
needlong = 0
for i in cc:
#ilong是得到i的长度,方便后面加减
#needlong是我想要的长度
ilong=len(i)
needlong += ilong
print('ilong',ilong,'needlong ',needlong )
if needlong <500:
#再把句号加回去,我之所以不适用join链接,是因为使用join会突然重复链接,不知道
#为什么,所以选择了这样一个链接方式
trasdata = trasdata+i+'.'
print('trasdata',len(trasdata))
else:
#如果大于500了,就先把这句分割好储存起来,本句话就直接留给下一句中
if len(trasdata)>0:
print('满了就添加')
data.append(trasdata)
if ilong <500:
trasdata = i
needlong =ilong
else:
i =i.join('.')
data.append(i)
trasdata = ''
needlong =0
return data
#直接执行就可以了,记住输入必须是列表,里面的元素必须是字符串
out=relayNumberSplit(cc)
#我试过是直接成果的
out[0]