#ss:输入字符串
#sig:符号
#count 截取长度
ss='''
渐渐地,大家就不怎么关注战场了,斑头雁回来了,对于他来说,就是一个新的开始。
'''
import re
def chaifen(ss,sig,count=5):
data_list=[]
pos=0
index_id=0
#如果可以找到符号进入while循环
while(pos!=-1):
#从最左侧开始找,以限制长度为结束count
pos=ss[0:count].rfind(sig)
#如果找到符号加入列表,截断字符串,接着在限制count情况下找符号;
if pos!=-1:
pos=pos+1
data_list.append((index_id,ss[0:pos]))
index_id+=1
ss=ss[pos:]
elif pos==-1 and ss.find(sig)!=-1:
#如果没有找到符号,但是ss字符串里有符号那么,那么不以count为准,且找到标点符号为止,然后截断字符串并加入列表;
pos=ss.find(sig)
pos=pos+1
data_list.append((index_id,ss[0:pos]))
index_id+=1
ss=ss[pos:]
#如果初始的时候就没找到符号,那么直接加入列表
if len(ss)>0:
data_list.append((index_id,ss))
index_id+=1
return data_list
if __name__=="__main__":
mm=chaifen(ss,'。')
print(mm)
根据符号截断文章并且限制
于 2024-03-06 13:34:07 首次发布