python 正则分组替换,根据分组值的长度判读进行替换

python 正则分组替换,根据分组值的长度判读进行替换

strs='''
aaaaaa<a id="a_detail_0" href="javascript:;" partid='0' startIndex='1571' class=red>bbbbbbb</a>cccccc<a id="a_detail_0" href="javascript:;" partid='0' startIndex='1571' class=red>dddddd</a>eeeee
'''
       pat=r'(<a id="a_detail_\d+" href="javascript:;" partid=\'\d+\' startIndex=\'\d+\' class=red>)(.+?)(</a>)'
        #定义一个过滤函数str_len,如果分组内容<100字,则,替换的内容还是自己,否则填好为去掉a标签的内容
        def str_len(matched):
            Strs = matched.group(2)#匹配的第二项
            if len(Strs) < 100:
                Strs = matched.group(1) + matched.group(2) + matched.group(3)
            return Strs#返回填好的词
        正则替换,正在表达式第二项为可以为字符串,表达式,分组\g<1>,函数
        line = re.sub(pat,str_len,line)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值