Rob Pike在《The Practice of Programming》中使用约30行代码,实现了一个正则表达式匹配器,用来处理以下的模型。
这段代码真是太酷了。
c | 匹配认字的字母c |
.(句点) | 匹配任意的单个字符 |
^ | 匹配输入字符串的开头 |
$ | 匹配输入字符串的结尾 |
* | 匹配前一个字符的零个或者多个出现 |
/*match :在text中查找regexp*/
int match(char* regexp,char* text)
{
if(regexp[0] == '^')
return matchhere(regexp+1,text);
do{ /*即使字符串为空也必须检查*/
if(matchhere(regexp,text))
return 1;
}while(*text++ !='\0');
return 0;
}
/*matchhere :在text的开头查找regexp*/
int matchhere(char* regexp,char* text)
{
if(regexp[0] == '\0')
return 1;
if(regexp[1] == '*')
return matchstar(regexp[0],regexp+2,text);
if(regexp[0] == '$' && regexp[1] == '\0')
return *text == '\0';
if(*text != '\0' && (regexp[0] == '.' || regexp[0] == *text))
return matchhere(regexp+1,text+1);
return 0;
}
/*matchstar :在text的开头查找c*regexp*/
int matchstar(int c,char* regexp,char* text)
{
do{ /*通配符×匹配零个或多个实例*/
if(matchhere(regexp,text))
return 1;
}while(*text != '\0' && (*text++ == c || c == '.'));
return 0;
}
int match(char* regexp,char* text)
{
if(regexp[0] == '^')
return matchhere(regexp+1,text);
do{ /*即使字符串为空也必须检查*/
if(matchhere(regexp,text))
return 1;
}while(*text++ !='\0');
return 0;
}
/*matchhere :在text的开头查找regexp*/
int matchhere(char* regexp,char* text)
{
if(regexp[0] == '\0')
return 1;
if(regexp[1] == '*')
return matchstar(regexp[0],regexp+2,text);
if(regexp[0] == '$' && regexp[1] == '\0')
return *text == '\0';
if(*text != '\0' && (regexp[0] == '.' || regexp[0] == *text))
return matchhere(regexp+1,text+1);
return 0;
}
/*matchstar :在text的开头查找c*regexp*/
int matchstar(int c,char* regexp,char* text)
{
do{ /*通配符×匹配零个或多个实例*/
if(matchhere(regexp,text))
return 1;
}while(*text != '\0' && (*text++ == c || c == '.'));
return 0;
}