CSP URL映射

最新推荐文章于 2021-09-06 23:36:16 发布

as1171799253

最新推荐文章于 2021-09-06 23:36:16 发布

阅读量1.8k

点赞数 3

分类专栏： c 文章标签： C CSP C

本文链接：https://blog.csdn.net/as1171799253/article/details/80667819

版权

c 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

问题描述

试题编号：	201803-3
试题名称：	URL映射
时间限制：	1.0s
内存限制：	256.0MB
问题描述：	问题描述　　URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求，URL 映射模块会解析请求中的 URL 地址，并将其分派给相应的处理代码。现在，请你来实现一个简单的 URL 映射功能。　　本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时，URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时，匹配成功，得到匹配的规则以及匹配的参数。若不能匹配任何一条规则，则匹配失败。　　本题输入的 URL 地址是以斜杠 / 作为分隔符的路径，保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如，/person/123/ 是一个合法的 URL 地址，而 /person/123? 则不合法（存在不合法的字符问号 ?）。另外，英文字母区分大小写，因此 /case/ 和 /CAse/ 是不同的 URL 地址。　　对于 URL 映射规则，同样是以斜杠开始。除了可以是正常的 URL 地址外，还可以包含参数，有以下 3 种：　　字符串 <str>：用于匹配一段字符串，注意字符串里不能包含斜杠。例如，abcde0123。　　整数 <int>：用于匹配一个不带符号的整数，全部由阿拉伯数字组成。例如，01234。　　路径 <path>：用于匹配一段字符串，字符串可以包含斜杠。例如，abcd/0123/。　　以上 3 种参数都必须匹配非空的字符串。简便起见，题目规定规则中 <str> 和 <int> 前面一定是斜杠，后面要么是斜杠，要么是规则的结束（也就是该参数是规则的最后一部分）。而 <path> 的前面一定是斜杠，后面一定是规则的结束。无论是 URL 地址还是规则，都不会出现连续的斜杠。输入格式　　输入第一行是两个正整数 n 和 m，分别表示 URL 映射的规则条数和待处理的 URL 地址个数，中间用一个空格字符分隔。　　第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri，其中 pi 表示 URL 匹配的规则，ri 表示这条 URL 匹配的名字。两个字符串都非空，且不包含空格字符，两者中间用一个空格字符分隔。　　第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi，表示待处理的 URL 地址，字符串中不包含空格字符。输出格式　　输入共 m 行，第 i 行表示 qi 的匹配结果。如果匹配成功，设匹配了规则 pj ，则输出对应的 rj。同时，如果规则中有参数，则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败，则输出 404。样例输入 5 4 /articles/2003/ special_case_2003 /articles/<int>/ year_archive /articles/<int>/<int>/ month_archive /articles/<int>/<int>/<str>/ article_detail /static/<path> static_serve /articles/2004/ /articles/1985/09/aloha/ /articles/hello/ /static/js/jquery.js 样例输出 year_archive 2004 article_detail 1985 9 aloha 404 static_serve js/jquery.js 样例说明　　对于第 1 个地址 /articles/2004/，无法匹配第 1 条规则，可以匹配第 2 条规则，参数为 2004。　　对于第 2 个地址 /articles/1985/09/aloha/，只能匹配第 4 条规则，参数依次为 1985、9（已经去掉前导零）和 aloha。　　对于第 3 个地址 /articles/hello/，无法匹配任何一条规则。　　对于第 4 个地址 /static/js/jquery.js，可以匹配最后一条规则，参数为 js/jquery.js。数据规模和约定　　1 ≤ n ≤ 100，1 ≤ m ≤ 100。　　所有输入行的长度不超过 100 个字符（不包含换行符）。　　保证输入的规则都是合法的。

一开始的思路是先对规则做处理，根据"/"做划分，用一个结构体rule来记录结果

class rule
{
public:
    string name;  // 规则名称
    vector<string> content;  // 划分后的每个内容 例如/<int>/abc 那么content为<int> abc /(末尾如果为/也要记录进content)
    rule(string a, vector<string> b) :name(a), content(b) {}
};

用一个handle函数来进行处理

void handle(string s, string name)
{
    int i, j, k;
    int spi;
    string str;
    vector<string> content;
    bool isslash = true;
    if (s[s.length() - 1] != '/'){
        isslash = false;
        s = s + "/";
    }
    spi = s.find("/");
    while (spi != -1) {
        str = s.substr(0, spi);
        s = s.substr(spi + 1, s.length());
        content.push_back(str);
        spi = s.find("/");
    }
    if (isslash)
        content.push_back("/");  // 末尾如果为"/"也记录进content
    rules.push_back(rule(name, content));
}

接着就是开始匹配，即每个规则的content与每个带匹配的ur进行逐个匹配，用一个循环

匹配过程中若是遇到参数<int><str>等，则记录到一个vector中，这里命名为result

循环如下

for (i = 0; i < rules[k].content.size() && urIndex < ur.size(); i++) {
        if (rules[k].content[i] == "<path>" && ur[urIndex].length() != 0) { // <path>后全为参数 可直接结束
            str = ur[urIndex];
            for (j = urIndex + 1; j < ur.size(); j++) {  // 直接添加之后的所有路径作为参数
                if (ur[j] == "/")  // 若末尾是'/' 直接添加
                    str = str + "/";
                else
                    str = str + "/" + ur[j];
            }
            result.push_back(str);
            urIndex = ur.size(); // <path>后直接全部作为参数 urIndex指向末尾表示匹配完成
            i = rules[k].content.size();  // <path>后直接全部作为参数 i指向末尾表示匹配完成
        }
        else if (rules[k].content[i] == "<int>" && ur[urIndex].length() != 0) { // <int>

            if (judgeNum(ur[urIndex])) {  // 如果待匹配路径为数字(与<int>匹配)
                result.push_back(int_to_string(string_to_int(ur[urIndex])));  // 添加参数
                urIndex++;
            }
            else {
                ifMatch = false;
                break;
            }
        }
        else if (rules[k].content[i] == "<str>" && ur[urIndex].length() != 0) { // <str>
            result.push_back(ur[urIndex]);  // <str>直接匹配  添加参数
            urIndex++;
        }
        else {
            if (rules[k].content[i] == ur[urIndex]) {
                urIndex++;       // 匹配路径
            }
            else {  // 路径不匹配
                ifMatch = false;
                break;
            }
        }
    }

    if (urIndex != ur.size() || i<rules[k].content.size()) // 双方未匹配完 匹配失败
        ifMatch = false;

总体思路就是这样，这里要强调的是一些坑

例如规则若是为 /abc/<int> test

输入的为 /abc/1 则可以匹配，若是输入为 /abc/1/ 则匹配失败

这是题目没有讲清楚的，为了处理这种情况，所以末尾的"/"我也当成要匹配的一部分

若是规则为/abc/<path>

输入为 /abc/123/ 还是/abc/123 均正确不过输出的参数分别为 123/ 与 123

代码如下

#include<cstdio>
#include<algorithm>
#include<iostream>
#include<iomanip>
#include<vector>
#include<string>
#include<string.h>
#include<sstream>
using namespace std;

class rule
{
public:
	string name;
	vector<string> content;
	rule(string a, vector<string> b) :name(a), content(b) {}
};

vector<rule> rules;
bool ifMatch;

int string_to_int(string s)
{
	int ans;
	stringstream ss(s);
	ss >> ans;
	return ans;
}

string int_to_string(int a)
{
	stringstream ss;
	ss << a;
	return ss.str();
}

bool judgeNum(string s)
{
	for (int i = 0; i<s.length(); i++)
		if (s[i]>'9' || s[i]<'0') return false;
	return true;
}

void handle(string s, string name)
{
	int i, j, k;
	int spi;
	string str;
	vector<string> content;
	bool isslash = true;
	if (s[s.length() - 1] != '/') {
		isslash = false;
		s = s + "/";
	}
	spi = s.find("/");
	while (spi != -1) {
		str = s.substr(0, spi);
		s = s.substr(spi + 1, s.length());
		content.push_back(str);
		spi = s.find("/");
	}
	if (isslash)
		content.push_back("/");
	rules.push_back(rule(name, content));
}

vector<string> match(int k, string url)
{
	int i, j;
	int spi;
	string str;
	bool isslash = true;
	vector<string> result;
	vector<string> ur;
	if (url[url.length() - 1] != '/') {
		isslash = false;
		url = url + "/";
	}
	int urIndex = 0;
	spi = url.find("/");
	while (spi != -1) {
		str = url.substr(0, spi);
		url = url.substr(spi + 1, url.length());
		ur.push_back(str);
		spi = url.find("/");
	}
	if (isslash)
		ur.push_back("/");

	for (i = 0; i < rules[k].content.size() && urIndex < ur.size(); i++) {
		if (rules[k].content[i] == "<path>" && ur[urIndex].length() != 0) { // <path> 后面一定是结束了
			str = ur[urIndex];
			for (j = urIndex + 1; j < ur.size(); j++) {  // 直接添加之后的所有路径作为参数
				if (ur[j] == "/")  // 若末尾是'/' 直接添加
					str = str + "/";
				else
					str = str + "/" + ur[j];
			}
			result.push_back(str);
			urIndex = ur.size(); // <path>后直接全部作为参数 urIndex指向末尾表示匹配完成
			i = rules[k].content.size();  // <path>后直接全部作为参数 i指向末尾表示匹配完成
		}
		else if (rules[k].content[i] == "<int>" && ur[urIndex].length() != 0) { // <int>

			if (judgeNum(ur[urIndex])) {  // 如果待匹配路径为数字(与<int>匹配)
				result.push_back(int_to_string(string_to_int(ur[urIndex])));  // 字符串转数字后再转字符串 去除0
				urIndex++;
			}
			else {
				ifMatch = false;
				break;
			}
		}
		else if (rules[k].content[i] == "<str>" && ur[urIndex].length() != 0) { // <str>
			result.push_back(ur[urIndex]);  // <str>直接匹配
			urIndex++;
		}
		else {
			if (rules[k].content[i] == ur[urIndex]) {
				urIndex++;
			}
			else {
				ifMatch = false;
				break;
			}
		}
	}
	// 未匹配完
	if (urIndex != ur.size() || i < rules[k].content.size()) 
	{
		ifMatch = false;

	}
	return result;
}

int main()
{
	int n, m, i, j, k;
	string format, name, url;
	cin >> n >> m;
	for (i = 0; i<n; i++) {
		cin >> format >> name;
		format = format.substr(1, format.length());
		handle(format, name);
	}

	for (i = 0; i<m; i++) {
		cin >> url;
		url = url.substr(1, url.length());
		// 开始逐个匹配
		for (j = 0; j<n; j++) {
			ifMatch = true;
			vector<string> vec = match(j, url);
			if (ifMatch) {
				cout << rules[j].name;
				for (int h = 0; h<vec.size(); h++)
					cout << " " << vec[h];
				cout << endl;
				break;
			}
		}
		if (j == n) cout << "404" << endl;
	}
	return 0;
}