Regex to ε-NFA

本文详细介绍了如何将正则表达式(Regex)转换为ε-非确定有限自动机(ε-NFA)。首先,对Regex进行预处理,包括添加连接标识符并将其转化为后缀表达式。接着,阐述了Regex的基本运算如何转换为ENFA,通过使用栈来存储NFA状态,并使用链表结构存储边信息。然后,讲解了单个字符和整个Regex如何构建ENFA。最后,提到了综合运用这些方法进行转换的测试过程。
摘要由CSDN通过智能技术生成

Regex预处理

    假设只处理连接、或和*闭包这三种基本的Regex。因为Regex的连接格式为ab,为了方便计算机识别,得添加连接标识符。在计算机处理Regex时,一般都使用stack,为了方便计算机识别,通常将人类习惯的中缀表达式(1+1)转换为后缀表达式(11+)。

添加连接标识符

/// <summary>
/// 给正则表达式加入连接标识符“.”<br/>
/// e.g.<br/>
/// (ab|ba)*ab    ——>     (a.b|b.a)*.a.b
/// </summary>
public static string UseDotForConcatenation(string regex)
{
    for (var i = 0; i < regex.Length - 1; ++i)
    {
        var cur = regex[i];
        if (cur != '|' && cur != '(')
        { // Don't add '.' after '|' and '('
            var next = regex[i + 1];
            if (next != '|' && next != '*' && next != ')')
            { // Don't add '.' if '|', '*', ')' are the next characters
                regex = new StringBuilder(regex).Insert(++i, ".").ToString();
            }
        }
    }
    return regex;
}


[TestMethod]
public void UseDotForConcatenationTest()
{
    var regex = "((abcd|dcac)*|abba)*addcb";
    var test = UseDotForConcatenation(regex);
    Debug.WriteLine(test);
}

输出如下:
((a.b.c.d|d.c.a.c)*|a.b.b.a)*.a.d.d.c.b

转换为后缀表达式

/// <summary>
/// 将加入连结符后的正则表达式转换为后缀表示法<br/>
/// e.g.<br/>
/// (a.b|b.a)*.a.b    ——>     ab.ba.|*a.b.
/// </summary>
public static string InfixToPostfix(string infixRegex)
{
    var stack = new Stack<char>();

    var postfixRegex = new StringBuilder(infixRegex.Length << 1);
    for (var i = 0; i < infixRegex.Length; ++i)
    {
        var ch = infixRegex[i];
        switch (ch)
        {
            case '.':
            case '|':
                while (stack.Count > 0 && Precedence(ch) <= Precedence(stack.Peek()))
                {
                    postfixRegex.Append(stack.Pop());
                }
                stack.Push(ch);
                break;

            case '(':
                stack.Push(ch);
                break;

            case ')':
                while (stack.Count > 0 && stack.Peek() != '(')
                {
                    postfixRegex.Append(stack.Pop());
                }
                stack.Pop();
                break;

            default:
                postfixRegex.Append(ch);
                break;
        }
    }

    while (stack.Count > 0)
    {
        postfixRegex.Append(stack.Pop());
    }

    return postfixRegex.ToString();
}
/// <summary>
/// 字符的优先级
/// </summary>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值