Python算法题集_找到字符串中所有字母异位词

本文为Python算法题集之一的代码示例

题目438:找到字符串中所有字母异位词

说明:给定两个字符串 sp,找到 s 中所有 p异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。

异位词 指由相同字母重排列形成的字符串(包括相同的字符串)。

示例 1:

输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。

示例 2:

输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。

提示:

  • 1 <= s.length, p.length <= 3 * 104

  • sp 仅包含小写字母


问题分析

  1. 因p是固定的,所以检查是否为p的异位词可以直接使用数组的字符计数比较即可【p仅含小写字母,因此数组只有26个元素】
  2. 因p长度固定,因此单循环即可遍历字符串
  3. 优化思路
    1. 减少计算
    2. 加快比较

  1. 标准版【循环进行异位词比较】,性能良好,超越89%,标准版的性能就比较高,说明本题可以优化的空间不大

    注意:CheckFuncPerf是我手搓的函数用时和内存占用模块,下载地址在这里:测量函数运行用时、内存占用的代码单元CheckFuncPerf.py以及使用方法
    在这里插入图片描述

    import CheckFuncPerf as cfp
    
    def findAnagrams(s: str, p: str) -> list[int]:
        list_p = [0] * 26
        list_s = [0] * 26
        list_result = []
        for iIdx in range(len(p)):
            list_p[ord(p[iIdx])-ord('a')] += 1
        for iIdx in range(len(s)):
            list_s[ord(s[iIdx])-ord('a')] += 1
            if iIdx < len(p) - 1:
                continue
            if list_s == list_p:
                list_result.append(iIdx - len(p) + 1)
            list_s[ord(s[iIdx-len(p)+1]) - ord('a')] -= 1
        return list_result
    
    s, p = 'cbaebabacd', 'abc'
    result = cfp.getTimeMemoryStr(findAnagrams, s, p)
    print(result['msg'],'执行结果={}'.format(result['result']))
    # 运行结果
    函数 findAnagrams 的运行时间为 0.00 ms;内存使用量为 4.00 KB 执行结果=[0, 6]
    
  2. 优化版【每次判断是否出现未出现在p中的字符,如出现进行跳跃】,性能自由落体,超越42%
    在这里插入图片描述

    这种优化有赖于p的特性,p的长度越长,优化效果越好;反之,因为每个字符都要多一次比较,性能反而会下降

    def findAnagrams_ext1(s: str, p: str) -> list[int]:
        list_p = [0] * 26
        list_s = [0] * 26
        list_result = []
        for iIdx in range(len(p)):
            list_p[ord(p[iIdx])-ord('a')] += 1
        iIdx, ileft = 0, 0
        while iIdx < len(s):
            if p.find(s[iIdx])<0:
                if iIdx<len(p):
                    for jIdx in range(iIdx):
                        list_s[ord(s[jIdx])-ord('a')] = 0
                else:
                    for jIdx in range(len(p)):
                        list_s[ord(s[iIdx-jIdx])-ord('a')] = 0
                iIdx += 1
                ileft = iIdx
                continue
            list_s[ord(s[iIdx])-ord('a')] += 1
            if iIdx < len(p) + ileft - 1:
                iIdx += 1
                continue
            if list_s == list_p:
                list_result.append(iIdx - len(p) + 1)
            list_s[ord(s[iIdx-len(p)+1]) - ord('a')] -= 1
            ileft += 1
            iIdx += 1
        return list_result
        
    s, p = 'cbaebabacd', 'abc'
    result = cfp.getTimeMemoryStr(findAnagrams_ext1, s, p)
    print(result['msg'],'执行结果={}'.format(result['result']))
    # 运行结果
    函数 findAnagrams_ext1 的运行时间为 0.00 ms;内存使用量为 0.00 KB 执行结果=[0, 6]
    
  3. 计算优化版【标准版中,将ord('a')先计算出来,避免每次计算】,性能优异,超越97%
    在这里插入图片描述

    def findAnagrams_iorda(s: str, p: str) -> list[int]:
        iOrda = ord('a')
        list_p = [0] * 26
        list_s = [0] * 26
        list_result = []
        for iIdx in range(len(p)):
            list_p[ord(p[iIdx])-iOrda] += 1
        for iIdx in range(len(s)):
            list_s[ord(s[iIdx])-iOrda] += 1
            if iIdx < len(p) - 1:
                continue
            if list_s == list_p:
                list_result.append(iIdx - len(p) + 1)
            list_s[ord(s[iIdx-len(p)+1]) - iOrda] -= 1
        return list_result
        
    s, p = 'cbaebabacd', 'abc'
    result = cfp.getTimeMemoryStr(findAnagrams_iorda, s, p)
    print(result['msg'],'执行结果={}'.format(result['result']))
    # 运行结果
    函数 findAnagrams_iorda 的运行时间为 0.00 ms;内存使用量为 0.00 KB 执行结果=[0, 6]
    
  4. 优化加强版【优化版中,将ord('a')先计算出来,避免每次计算】,性能一般,超越54%
    在这里插入图片描述

    def findAnagrams_ext1_iorda(s: str, p: str) -> list[int]:
        iOrda = ord('a')
        list_p = [0] * 26
        list_s = [0] * 26
        list_result = []
        for iIdx in range(len(p)):
            list_p[ord(p[iIdx])-iOrda] += 1
        iIdx, ileft = 0, 0
        while iIdx < len(s):
            if p.find(s[iIdx])<0:
                if iIdx<len(p):
                    for jIdx in range(iIdx):
                        list_s[ord(s[jIdx])-iOrda] = 0
                else:
                    for jIdx in range(len(p)):
                        list_s[ord(s[iIdx-jIdx])-iOrda] = 0
                iIdx += 1
                ileft = iIdx
                continue
            list_s[ord(s[iIdx])-iOrda] += 1
            if iIdx < len(p) + ileft - 1:
                iIdx += 1
                continue
            if list_s == list_p:
                list_result.append(iIdx - len(p) + 1)
            list_s[ord(s[iIdx-len(p)+1]) - iOrda] -= 1
            ileft += 1
            iIdx += 1
        return list_result
        
    s, p = 'cbaebabacd', 'abc'
    result = cfp.getTimeMemoryStr(findAnagrams_ext1_iorda, s, p)
    print(result['msg'],'执行结果={}'.format(result['result']))
    # 运行结果
    函数 findAnagrams_ext1_iorda 的运行时间为 0.00 ms;内存使用量为 0.00 KB 执行结果=[0, 6]
    

    一日练,一日功,一日不练十日空

    may the odds be ever in your favor ~

  • 12
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

长孤秋落

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值