问题描述
URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
1. 字符串 <str>
:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
2. 整数 <int>
:用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
3. 路径 <path>
:用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 <str>
和 <int>
前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 <path>
的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。
输入格式
输入第一行是两个正整数 n 和 m,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。
输出格式
输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。
样例输入
5 4
/articles/2003/ special_case_2003
/articles/<int>/ year_archive
/articles/<int>/<int>/ month_archive
/articles/<int>/<int>/<str>/ article_detail
/static/<path> static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js
样例输出
year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js
样例说明
对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。
数据规模和约定
1 ≤ n ≤ 100,1 ≤ m ≤ 100。
所有输入行的长度不超过 100 个字符(不包含换行符)。
保证输入的规则都是合法的。
代码实现
#include<iostream>
#include<cstring>
using namespace std;
string path[101];
string rule[101];
string url;
int n,m;
bool match(string u,string p,bool print)
{
int upos=0, ppos=0;
// 逐个字符匹配
while(upos<u.size() && ppos<p.size()){
// 字符相同,继续向下比较
if(u[upos]==p[ppos]){
upos++;
ppos++;
}
// 字符不同,参数则判断 或 不同字符直接匹配失败
else{
// 规则串该位置不为参数
if(p[ppos++]!='<'){
return false; // 匹配失败
}
// 打印空格作为分隔
if(print) cout<<" "; // 存在匹配,且有参数,需要空格作为分隔
// 规则串该位置为参数
if(p[ppos]=='i'){
bool ok = false;
// 字符存在 且为数字
while(u[upos] && isdigit(u[upos])){
if(u[upos]!='0') // 是不为0的数字
ok = true; // 匹配上 且可打印
if(print && ok) cout<<u[upos];
upos++;
}
if(!ok) return false; // 不存在
ppos += 4; // 存在,继续比较
}
else if(p[ppos]=='s'){
bool ok = false;
// 存在不为 '/'的字符
while(u[upos] && u[upos]!='/'){
ok = true; // 匹配上 且可打印
if(print && ok) cout<<u[upos];
upos++;
}
if(!ok) return false; // 不存在
ppos += 4; // 存在,继续比较
}
else if(p[ppos]=='p'){ // path一定可匹配
while(u[upos]){
if(print) cout<<u[upos];
upos++;
}
return true;
}
}
}
// 两个字符串均匹配完且到串尾 -> 匹配成功
// 否则一个到达串尾,另一个未匹配完 -> 匹配失败
return upos==u.size() && ppos==p.size();
}
int main()
{
cin>>n>>m;
for(int i=0;i<n;i++){
cin>>path[i]>>rule[i];
}
// m条url匹配
while(m--){
cin>>url;
int flag = false; // 是否匹配
for(int i=0;i<n;i++){
if(match(url,path[i],false)){ // 匹配上
cout<<rule[i];
match(url,path[i],true); // 打印出来
cout<<endl;
flag = true;
break;
}
}
if(!flag){ // 未匹配
cout<<"404"<<endl;
}
}
return 0;
}