[Java] 201803-3 URL映射

  • 总算是通过了,最后一次拿90分的时候,题目给的测试样例都没通过,没认真测试啊
  • 所以打CSP,还是要严谨缜密的逻辑,以及千锤百炼的测试

  • 问题描述
      URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
      本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
      本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
      对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
      字符串 :用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
      整数 :用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
      路径 :用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
      以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 和 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。

  • 输入格式
      输入第一行是两个正整数 n 和 m,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
      第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
      第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。

  • 输出格式
      输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。

  • 样例输入

5 4
/articles/2003/ special_case_2003
/articles/<int>/ year_archive
/articles/<int>/<int>/ month_archive
/articles/<int>/<int>/<str>/ article_detail
/static/<path> static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js
  • 样例输出
year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js
  • 样例说明
      对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
      对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
      对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
      对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。
  • 数据规模和约定
      1 ≤ n ≤ 100,1 ≤ m ≤ 100。
      所有输入行的长度不超过 100 个字符(不包含换行符)。
      保证输入的规则都是合法的。
import java.io.*;
import java.util.*;
import java.util.regex.Pattern;

public class Main {

    public static void main(String[] args) throws IOException {
		// Use BufferedReader rather than RandomAccessFile; it's much faster
        // BufferedReader f = new BufferedReader(new FileReader("test.in"));
        BufferedReader f = new BufferedReader(new InputStreamReader(System.in));
        PrintWriter out = new PrintWriter(new BufferedWriter(new OutputStreamWriter(System.out)));

		// Use StringTokenizer vs. readLine/split -- lots faster
		StringTokenizer st = new StringTokenizer(f.readLine());
	    int n = Integer.parseInt(st.nextToken());
	    int m = Integer.parseInt(st.nextToken());

        String[] origin = new String[n];
        String[] re = new String[n];
        String[] r = new String[n];
        for (int i = 0; i < n; i++) {
		    st = new StringTokenizer(f.readLine());
            String p = st.nextToken();
            r[i] = st.nextToken();
            origin[i] = p;
            
            // 字符串 <str>:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
            p = p.replace("<str>", "[\\w_\\.-]+");

            // 整数 <int>:用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
            p = p.replace("<int>", "(\\d+)");

            // 路径 <path>:用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
            // <path> 的前面一定是斜杠,后面一定是规则的结束
            p = p.replace("/<path>", "(/[\\w_\\.-]+)+/?");
            
            re[i] = p;
            // System.out.println(p);
        }

        for (int i = 0; i < m; i++) 
        {
            String q = f.readLine();
            // System.out.println(q);
            StringBuilder sb = new StringBuilder();
            for (int j = 0; j < n; j++) 
            {
                if (Pattern.matches(re[j], q))
                {
                    sb.append(r[j]);
                    // Todo: 在同一行内依次输出匹配后的参数
                    String[] val = q.split("/");
                    String[] reg = origin[j].split("/");
                    for (int k = 0; k < reg.length; k++)
                    {
                        if (reg[k].equals("<int>"))
                        {
                            // 整数参数输出时要把前导零去掉
                            sb.append(" ").append(val[k].replaceFirst("^0*", ""));
                        }
                        else if (reg[k].equals("<str>")) 
                        {
                            sb.append(" ").append(val[k]);
                        }
                        else if (reg[k].equals("<path>"))
                        {
                            // 这里应该是除正则表达式外最棘手的部分了:
                            // 由于我将其分割了,所以需要精准定位到原字符串对应的index
                            int fromIndex = 0;
                            for (int kk = 0; kk < k; kk++) {
                                fromIndex += val[kk].length() + 1;
                            }
                            sb.append(" ").append(q.substring(q.indexOf(val[k], fromIndex)));
                            // <path可能最后会带/,也可能不带/ (从80分到90分)
                            // sb.append(" ").append(q.substring(q.lastIndexOf(val[k])));
                            break;
                        }
                    }
                    break;
                }
            }
            if (sb.length() == 0) {
                System.out.println("404");
            } else {
                System.out.println(sb.toString());
            }
        }
	    out.close();
	    f.close();
	}
}

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值