字符串的内置方法只能返回第一个找到的元素的下标,numpy中其实已经实现了寻找元素的高效方法,如
np.argwhere
np.where
。但是现在我们要讲一讲如何不用第三方模块来实现同样的功能(明天就蓝桥杯了,赶紧抢救一下自己)
text = 'abcabcabc' # 源字符串
pat = r'b' # 待查找的字符
方法一:暴力搜索
这方法非常简单,就是一个for循环搞定,但是看起来也笨拙,可能很多次循环都是没用的
res = [] # 用于存放下标的列表
for idx, each in enumerate(s):
if each == 'pat':
res.append(idx)
方法二:正则表达式模块
关于该模块的详细说明,我也撰写了一篇博客。正则表达式有re.match
,re.search
,re.fullmatch
这些方法,但都只能返回一个匹配项,pass掉;还有re.finditer
,re.findall
这些方法,其中后者不能返回下标,而前者虽然不能一次性返回,需要遍历,但至少是有下标信息的,因此选择re.finditer
方法来实现。
import re
res = [] # 用于存放下标的列表
for each in re.finditer(pat,text):
res.append(each.span()[0]) # span是一个表示区间的元组,如果只要查找单字符,取区间左端点
这么做可以保证循环中每次遍历到的元素都是有效的。
方法三:filter过滤器
没有循环,总共只要三步,当然如果你不觉得晦涩难懂的话,可以强行写成一步~
>>>s_idx = list(zip(range(len(s)),s)) # 生成下标
>>>s_idx
[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'a'), (4, 'b'), (5, 'c'), (6, 'a'), (7, 'b'), (8, 'c')]
>>>res_idx = list(filter(lambda x:x[1]==pat,s_idx)) # 过滤掉不满足条件的元素
>>>res_idx
[(1, 'b'), (4, 'b'), (7, 'b')]
>>>res = list(zip(*res_idx))[0] # 反用zip,重新组合生成下标序列
>>>res
(1,4,7)