错题集（已解决）：正则表达式截取长字符串内相同的小串

最新推荐文章于 2023-03-10 13:09:49 发布

啊有猫

最新推荐文章于 2023-03-10 13:09:49 发布

阅读量563

点赞数

分类专栏： python 正则表达式文章标签：正则表达式前端后端

本文链接：https://blog.csdn.net/qq_39360343/article/details/121809196

版权

递归解题正则表达式字符串处理重复子串列表解析

关键词由CSDN通过智能技术生成

python 同时被 2 个专栏收录

15 篇文章 1 订阅

订阅专栏

正则表达式

1 篇文章 0 订阅

订阅专栏

在朋友那里看到一个很有意思的题目，当然原因可能是我其实比较少有复杂的、递归解题经验，所以就做得很痛苦，其中有一个类似如下的需求：

lst = [0, 1, 0, 0, 2, 0, 0, 0, 34, 0, 0, 0, 0]

要求：将形如上文中的所有带有0的列表单独截取出来

解决方法

首先想到的是re.findall，所以将整个列表转化成字符串并截取，分成首、尾、中间三种类型来处理：

# 截取开头是0的段落
re.findall('^\[(([0, ]+), [1-9]+)?,',str(lst))

得到 [(‘0, 1’, ‘0’)] ，没有问题

# 截取末尾是0的段落
re.findall('( [1-9]+, ([0, ]+))]$',str(lst))

得到 [(’ 34, 0, 0, 0, 0’, ‘0, 0, 0, 0’)] ，没有问题

中间出问题的部分

# 截取中间是0的段落
re.findall('( ?[1-9]+, ([,0 ]+?), [1-9]+?,)',str(lst))

得到 [(’ 1, 0, 0, 2,’, ‘0, 0’)] ，只拿到了第一段，漏掉了[2,0,0,0,34]

考虑原因是re.findall在第一次获取字符串的时候只对’2’读取一次，后面的字符串就不取‘2’了。
也不知道该怎么解决，就用了一个比较愚蠢的办法，将该列表中所有前后都是0的非零数重复一次：

lst = [0, 1, 0, 0, 2, 0, 0, 0, 34, 0, 0, 0, 0]
for i in range(1, len(lst)-1):
    lst = lst[:i+1]+lst[i:] if lst[i] != 0 and lst[i-1] ==0 and lst[i+1] == 0 else lst
print(lst)

得到 lst = [0, 1, 1, 0, 0, 2, 2, 0, 0, 0, 34, 34, 0, 0, 0, 0]

# 再次对新lst截取中间是0的段落
lst = [0, 1, 1, 0, 0, 2, 2, 0, 0, 0, 34, 34, 0, 0, 0, 0]
re.findall('( ?[1-9]+, ([,0 ]+?), [1-9]+?,)',str(lst))

得到 [(’ 1, 0, 0, 2,’, ‘0, 0’), (’ 2, 0, 0, 0, 34,’, ‘0, 0, 0’)] ，成功

整体脚本

def reint(str_mpt):
    """
    str还原list函数
    """
    return [int(i) for i in str_mpt.replace('[','').replace(']','').split(',') if i not in ['']]

def find0(lst):
    """
    找全零
    """
    frs = re.findall('^\[(([0, ]+), [1-9]+)?,',str(lst))  # 首
    las = re.findall('( [1-9]+, ([0, ]+))]$',str(lst))    # 尾
    for i in range(1, len(lst)-1):
        lst = lst[:i+1]+lst[i:] if lst[i] != 0 and lst[i-1] ==0 and lst[i+1] == 0 else lst
    mdl = re.findall('( ?[1-9]+, ([,0 ]+?), [1-9]+?,)',str(lst))  # 中间
    return [(reint(i[0]),reint(i[1])) for i in frs+mdl+las]