Java中的正则匹配

最新推荐文章于 2021-08-27 21:58:51 发布

秦朝古月

最新推荐文章于 2021-08-27 21:58:51 发布

阅读量120

点赞数

分类专栏： Java 文章标签： Java Swing XML HTML

本文链接：https://blog.csdn.net/ilgnep2009/article/details/83668802

版权

Java 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

想用Java解析Html里面的标签，例如我要解析html里面的 <link rel="openid.server" href="http://www.xxxxxx.com" />。可以使用 javax.swing.text.html.parser 或者org.htmlparser 或者 javax.xml.parsers.SAXParser。不过，要求Html必须是一个规范的XML格式，而网页基本上都不符合。

所以采用正则匹配来解决。

import ...
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public final class HttpTookit {
    private static Log log = LogFactory.getLog(HttpTookit.class);

    public static String doGet(String url, String queryString) {
        ...
        return response;
    }

    public static void main(String[] args) {
        String x = doGet("http://www.xxxxx.com", "");
        System.out.println(x);
        Pattern p = Pattern.compile(".* href=\"(.*)\" />.*");
        Matcher m  = p.matcher(x);
        //m.matches(); 不知道为什么这里匹配不到
        if (m.find()) {
        	System.out.println("m.group():" + m.group(1));
        }

    }
}