根据符号截断文章并且限制

#ss:输入字符串
#sig:符号
#count 截取长度

ss='''
    渐渐地,大家就不怎么关注战场了,斑头雁回来了,对于他来说,就是一个新的开始。
'''

import re
def chaifen(ss,sig,count=5):
    data_list=[]
    pos=0
    index_id=0
    #如果可以找到符号进入while循环
    while(pos!=-1):
        #从最左侧开始找,以限制长度为结束count
        pos=ss[0:count].rfind(sig)
        #如果找到符号加入列表,截断字符串,接着在限制count情况下找符号;
        if pos!=-1:
            pos=pos+1
            data_list.append((index_id,ss[0:pos]))
            index_id+=1
            ss=ss[pos:]
        elif pos==-1 and ss.find(sig)!=-1:
            #如果没有找到符号,但是ss字符串里有符号那么,那么不以count为准,且找到标点符号为止,然后截断字符串并加入列表;
            pos=ss.find(sig)
            pos=pos+1
            data_list.append((index_id,ss[0:pos]))
            index_id+=1
            ss=ss[pos:]
    #如果初始的时候就没找到符号,那么直接加入列表
    if len(ss)>0:
        data_list.append((index_id,ss))
        index_id+=1
    return data_list


if __name__=="__main__":
    mm=chaifen(ss,'。')
    print(mm)

  • 12
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值