CCF URL映射 100分(正则表达式)

关于C++中正则表达式的知识,请参考这两篇博客,我也是看的这两篇博客就大致清楚怎么用了。

https://blog.csdn.net/weixin_42416780/article/details/89791826  这个对方法的介绍比较详细。

https://blog.csdn.net/philpanic9/article/details/88141305 这个可以只看开头那个表格,那个表格很好懂。

关于捕获组的问题:https://www.runoob.com/java/java-regular-expressions.html,可以看这里面的捕获组,虽然这篇文章讲的是java的捕获组,但是跟c++相同。

这道题用正则表达式很好做,这个思路来自于这篇文章:https://blog.csdn.net/richenyunqi/article/details/85260248

试题编号:201803-3
试题名称:URL映射
时间限制:1.0s
内存限制:256.0MB
问题描述:

问题描述

  URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
  本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
  本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
  对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
  字符串 <str>:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
  整数 <int>:用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
  路径 <path>:用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
  以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 <str> 和 <int> 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 <path> 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。

输入格式

  输入第一行是两个正整数 nm,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
  第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 piri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
  第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。

输出格式

  输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。

样例输入

5 4
/articles/2003/ special_case_2003
/articles/<int>/ year_archive
/articles/<int>/<int>/ month_archive
/articles/<int>/<int>/<str>/ article_detail
/static/<path> static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js

样例输出

year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js

样例说明

  对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
  对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
  对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
  对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。

数据规模和约定

  1 ≤ n ≤ 100,1 ≤ m ≤ 100。
  所有输入行的长度不超过 100 个字符(不包含换行符)。
  保证输入的规则都是合法的。

#include<iostream>
#include<regex>
#include<algorithm>
#include<string>
#include<sstream>
#include<vector>
using namespace std;

/*
** 规则
** rulename:指的是规则的名字
** rulepattern:规则对应的正则表达式 
** 比如对这个url映射规则来说:/articles/<int>/ year_archive 
** rulename :  year_archive 
** rulepattern : /articles/([0-9]+)/ 
*/
struct Rule{
	string rulename;
	regex rulepattern;
	Rule(string name,regex pattern){
		this->rulename = name;
		this->rulepattern = pattern;
	}
};

/*
** url映射规则里面的参数和正则表达式的对应关系 
** 比如这个url映射规则:/articles/<int>/<int>/<str>/ article_detail 
** 参数:<int> 和 <str>
** 参数对应的正则表达式分别为: ([0-9]+) 和 ([a-zA-Z0-9-_./]+)
*/
struct Transfer{
	regex from;
	string to;	
};

vector<Rule> rules;  //存放正则表达式组成的映射规则 
vector<Transfer> transfer = {
	{regex("<int>"),"([0-9]+)"},
	{regex("<str>"),"([a-zA-Z0-9-_.]+)"},
	{regex("<path>"),"([a-zA-Z0-9-_./]+)"}
}; //存放参数和正则表达式的对应关系 

/*
** 判断参数是不是数字,如果是的话,要去掉前导0。 
*/
bool myIsDigit(string input){
	for(int i=0;i<input.length();i++){
		if(!isdigit(input[i])){
			return false;
		}
	}
	return true;
}

/*
** string转int,也是去掉前导0的过程。 
*/
int toInt(string str){
	istringstream input(str);
	int ans;
	input>>ans;
	return ans;
}

int main(){
	int n,m; 
	string pattern,name;
	string url;
	cin>>n>>m;
	while(n--){
		cin>>pattern>>name;
		/*
		** 把带有参数的url映射规则,转换为带有正则表达式的url映射规则 
		** 比如把这个带有参数的映射规则:/articles/<int>/<int>/<str>/
		** 转换为: /articles/([0-9]+)/([0-9]+)/([a-zA-Z0-9-_.]+)/ 
		*/
		for(int i=0;i<transfer.size();i++){
			pattern = regex_replace(pattern,transfer[i].from,transfer[i].to);
		}
		rules.push_back(Rule(name,regex(pattern)));
	}	
	while(m--){
		cin>>url;
		/*
		** 存放匹配成功后的捕获组。 
		*/
		smatch group;
		bool flag = false;
		/*
		** 用映射规则依次进行匹配 
		*/
		for(int i=0;i<rules.size();i++){
			if(regex_match(url,group,rules[i].rulepattern)){ //如果匹配成功 
				cout<<rules[i].rulename;
				for(int i=1;i<group.size();i++){  //遍历每个匹配到的参数 
					if(myIsDigit(group[i])){  //参数是不是数字 
						cout<<" "<<toInt(group[i]);
					}else{
						cout<<" "<<group[i];	
					}
				}
				cout<<endl;
				flag = true;
				break;
			}
		}
		if(!flag){
			cout<<"404"<<endl;
		}
	}
	
	return 0; 
} 

 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值