LeetCode #10 正则表达式匹配

给定一个字符串 s 和一个字符规律 p,实现一个支持 '.' 和 '*' 的正则表达式匹配。其中,'.' 匹配任意单个字符,而'*' 匹配零个或多个前面的那一个元素。所谓匹配,是要涵盖整个字符串s的,而不是部分字符串。

输入:s = "ab" p = ".*c"
输出:false

https://leetcode-cn.com/problems/regular-expression-matching/

一、递归法

使用双指针i、j的方式对两个字符串s、p进行移位匹配,当双指针分别指向两个字符串的末尾,即二者的大小分别为字符串长度时为匹配成功。否则当模式串已经指针移位结束,而主串的指针还未为主串长度时即匹配失败。具体的匹配的情况可以分成两种:

1、当p[j+1]!='*'时,这时仅需要考虑p[i]和s[j]是否相等的情况,如果相等那么就直接移动到下一个位置,即

主串指针+1,模式串+1

否则因为不匹配就直接返回false。

2、当p[j+1]=='*'且当前主串字符和模式串字符匹配时,那么分为多种情况:

匹配个数为0时,主串指针+0,模式串指针+2,如'a'和'c*'

匹配个数为1时,主串指针+1,模式串指针+2,如'a'和'a*'

匹配个数为2时,主指针+2,模式串指针+2,如'aa'和'a*'

匹配个数为n时,主指针+n,模式串指针+2

从上述情况当中可以看到要实现匹配个数为n时指针的移动是比较困难的,因此不移动模式串指针,而是每次匹配时移动主指针+1,这样就可以从匹配n此变为匹配0次。当然,要怎么判断何时匹配0次?这就需要每次在移动主指针之前先判断匹配个数是否已经是零次了。如果为0,那么就不用再移动主指针,而是将模式指针+2即可,简化为:

主串指针+0,模式串指针+2

若以上匹配错误则执行以下

主串指针+1,模式串指针

根据上面情况如此循环就可以抵达匹配0次的情况。


代码:

bool getMatchResult(int i, int j, const string& s, const string& p)
{
    if(j == p.length()) // 这里已经判断j是否越界,因此j + 1可以不用判断
    {
        return i == s.length(); // 当二者都相等于原字符串长度时则匹配正确
    }
    if (p[j + 1] == '*')
    {
        // 为防止后一个getMatch越界需要判断i的大小
        // 前一个getMatch的作用是i每次移位之前预先判断p是否已经走完这一次的'*'
        if (i != s.length() && (p[j] == s[i] || p[j] == '.'))
            return getMatchResult(i, j + 2, s, p) || getMatchResult(i + 1, j, s, p);
        else
            return getMatchResult(i, j + 2, s, p);
    }
    else
    {
        if (i != s.length() && (p[j] == s[i] || p[j] == '.'))
            return getMatchResult(i + 1, j + 1, s, p);
        else
            return false;
    }
}

bool isMatch(string s, string p)
{
    if (s.empty())
        return true;
    return getMatchResult(0, 0, s, p);
}

二、动态规划

动态规划的解法在思想上与递归方法一致,但在具体的实现上有所不同。首先需要声明m+1乘n+1大小的二维数组dp,因为在起始的时候dp[0][0]表示的意思是0和0长度的字符串是匹配的。如果起始的dp[0][0]表示的是两个字符串的第一个字符位置,那么就会不知道第一个dp[0][0]到底是true还是false,需要分情况进行讨论,而这已经在后续的循环中已经讨论了。另外,为了判定和递归法里一样的问题,即何时匹配为0,这就需要进行两次判断,第一次判断已经到0次匹配,第二次判断还是多次匹配,取二者的真值即可。


bool isMatch(string s, string p)
{
    const int m = s.length(), n = p.length();
    vector<vector<int>> dp(m + 1, vector<int>(n + 1));
    dp[0][0] = true;

    for (int i = 0; i <= m; ++i)
    {
        for (int j = 1; j <= n; ++j)
        {
            if (p[j - 1] == '*')
            {
                if (i > 0 && (s[i - 1] == p[j - 2] || p[j - 2] == '.')) // 不用担心越界问题,因为*前必要字符
                {
                    // |= 表示取二者的真值
                    dp[i][j] |= dp[i][j - 2];
                    dp[i][j] |= dp[i - 1][j];
                }
                else
                {
                    dp[i][j] |= dp[i][j - 2];
                }
            }
            else
            {
                if (i > 0) // i=0时即不匹配,不用处理
                {
                    if (s[i - 1] == p[j - 1] || p[j - 1] == '.')
                    {
                        dp[i][j] |= dp[i - 1][j - 1];
                    }
                    else
                    {
                        dp[i - 1][j - 1] = false;
                    }
                }
            }
        }
    }
    return dp[m][n];
}

进行代码优化:

bool isMatch(string s, string p)
{
    const int m = s.length(), n = p.length();
    vector<vector<int>> dp(m + 1, vector<int>(n + 1));
    dp[0][0] = true;

    auto matches = [&](int i, int j) {
            // if (i == 0) return false;
            return i > 0 && (s[i - 1] == p[j - 1] || p[j - 1] == '.');
    };

    for (int i = 0; i <= m; ++i)
    {
        for (int j = 1; j <= n; ++j)
        {
            if (p[j - 1] == '*')
            {
                dp[i][j] |= dp[i][j - 2];
                if (matches(i, j - 1)) // 不用担心越界问题,因为*前必要字符
                {
                    // |= 表示取二者的真值
                    dp[i][j] |= dp[i - 1][j];
                }
            }
            else
            {
                if (matches(i, j))
                {
                    dp[i][j] = dp[i - 1][j - 1];
                }
            }
        }
    }
    return dp[m][n];
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
正则表达式匹配一个经典的算问题,主要是判断一个字符串是否能够完全匹配给定的正则表式。 在LeetCode上,也有一道关于正则表达式匹配的题目,题目编号是10。这道题目要求实现一个支持 '.' 和 '*' 的正则表达式匹配,其中 '.' 可以匹配任意单个字符,'*' 可以匹配零个或多个前面的元素。 解决这道题可以使用动态规划的思想,具体的思路如下: 1. 创建一个二维数组dp,dp[i][j]表示s的前i个字符与p的前j个字符是否匹配。 2. 初始化dp为true,表示空字符串与空正则表达式是匹配的。 3. 初始化dp[i]为false,表示非空字符串与空正则表达式是不匹配的。 4. 初始化dp[j],如果p[j-1]是"*",则dp[j]的值取决于dp[j-2]的值,表示将p[j-2]与p[j-1]去掉后的正则表达式是否匹配空字符串。 5. 对于其它的dp[i][j],分成两种情况: - 如果p[j-1]是"."或者与s[i-1]相等,则dp[i][j]的值取决于dp[i-1][j-1]的值,表示将s[i-1]和p[j-1]去掉后的字符串是否匹配。 - 如果p[j-1]是"*",则dp[i][j]的值取决于以下两种情况: - dp[i][j-2]的值,表示将p[j-2]和p[j-1]去掉后的正则表达式是否匹配s的前i个字符。 - dp[i-1][j]的值,表示将s[i-1]与p[j-2]匹配后的字符串是否匹配p的前j个字符。 6. 最后返回dp[s.length()][p.length()]的值,表示整个字符串s与正则表达式p是否完全匹配。 以上是一种使用动态规划解决正则表达式匹配问题的思路,具体的实现可以参考LeetCode官方提供的递归思路的解。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [LeetCode —— 正则表达式匹配(详解官方动态规划思想)](https://blog.csdn.net/weixin_42100963/article/details/106953141)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值