算法:字符串匹配

题目:

要求给定子串,找出在主串中的第一次出现的位置。

1、暴力搜索,先找第一个字符,如果找到第一个字符,则再看第2个字符。

时间复杂度为:O(N2)**

import sys

if len(sys.argv) != 3:
    print("python3 %s <str including some words> <target>" % sys.argv[0])
    sys.exit()

s = sys.argv[1]
t = sys.argv[2]
length = len(t)
str_length = len(s)

flag = 0

for i in range(str_length):
    for j in range(length):
        if s[i] == t[j] and j < length - 1:
            i += 1
        elif s[i] == t[j] and j == length - 1:
            i = i - (length - 1) 
            flag = 1
            print("The index is:", i)
            break
        else:
            break

    if flag == 0 and i >= str_length - 1:
        print('There is no target in the string.')
        break
    elif flag == 1:
        break

2、str.index 内部是用 sunday 算法,从前往后匹配,在匹配失败时关注的是主串中参加匹配的最末位字符的下一位字符。

时间复杂度为:O(N)

import sys

if len(sys.argv) != 3:
    print("python3 %s <str including some words> <target>" % sys.argv[0])
    sys.exit()

strall = sys.argv[1]
target = sys.argv[2]
length = len(target)
str_length = len(strall)

shift = {}  # 储存目标字符中,每个字符的偏移量。将字符作为键,偏移量作为值。
for l in range(length):
    t = target[l]   
    shi = length - l    # 偏移量 = 目标字符的总长度 - 该字符的位置
    shift[t] = shi

i = 0
j = 0

while True:
    if strall[i] == target[j] and j < length - 1:   # 如果第一个字符比对上,继续比对接下来的字符。
        i += 1
        j += 1
    elif strall[i] == target[j] and j == length - 1:    # 如果字符比对上,且刚好比对到最后一个target。则完成比对。
        i = i - (length - 1)    # 输出target第一个字符,其在模式字符串中的位置。
        print("The index is:", i)
        break
    else:   # 如果有比对不上的字符,直接跳到target后面的那个字符。
        n = length - j + i
        j = 0
        if n <= str_length - 1: # 确保target后面有模式字符。
            s = strall[n]   # 读出字符。
            if s in target: # 如果字符在target中,读出偏移量,即i需要前进的量。
                i = i + shift[s]
            else:   # 如果该字符不在target中,则i直接跳到该字符后面的字符与target第一个字符来比较。
                i = n + 1
        else:   # 如果target后面没有字符,则模式字符串没有target。
            print('There is no target in the string.')
            break
    if i >= str_length or j >= length: # 如果模式字符串已经走完,则说明模式字符中没有target。注明:一般不可能j>=length,但写在这儿,以防报错。
        print('There is no target in the string.')
        break
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值