java正则表达式使用Demo

DEMO1:

//定义匹配表达式即正则表达式语句,

String regex = "^Java.*";

//定义匹配模式

Pattern pattern = Pattern.compile(regex);

//定义匹配器

Matcher matcher = pattern.matcher("Java不是人,是个啥啊!");

//判断是否

boolean b = matcher.matches();

//打印输出

System.out.println(b);

//定义匹配表达式即正则表达式语句,

String regex = "^Java.*";

//定义匹配模式

Pattern pattern = Pattern.compile(regex);

//定义匹配器

Matcher matcher = pattern.matcher("Java不是人,是个啥啊!");

//判断是否

boolean b = matcher.matches();

//打印输出

System.out.println(b);

demo2:

 

public class LearnRegexp {

    @Test
    public void testSearch() {
        String input = "hello1997&&2000";

        // 将一个正则表达式编译成Pattern对象
        Pattern pattern = Pattern.compile("\\w+");
        Matcher matcher = pattern.matcher(input);

        // matches尝试将整个字符序列与该模式匹配
        System.out.println(matcher.matches());

        // reset将matcher中的指针重新定位
        matcher.reset();
        // find 方法扫描整个字符串, 查找能否找到下一个符合该模式字符串
        while (matcher.find()) {
            String group = matcher.group();
            System.out.println(group);
        }
    }

    /**
     * 将所有的数字都替换成'#'
     */
    @Test
    public void testReplace() {
        String input = "1j2h3h4g5o";
        Matcher replace = Pattern.compile("[0-9]").matcher(input);
        input = replace.replaceAll("#");
        System.out.println(input);
    }

    /**
     * 将字符串按数字分割
     */
    @Test
    public void testSplit() {
        String input = "1j24h356h467g589o";
        String[] strings = input.split("\\d+");
        for (String str : strings) {
            System.out.println(str);
        }
    }
}

 

 

 

demo3:

 

/**
 * 模仿网络爬虫, 抓取网站html, 将里面所有的超链接都分析出来
 */
public class HtmlAnalyzer {

    private final String FILE_PATH = "/Users/jifang/save.txt";

    @Test
    public void client() throws IOException {
        String html = downloadHtml("http://www.163.com/", "gbk");
        // (?<=(href=\"))(?:[\w.\/\:\?\=\&]+)(?=\")  匹配url的正则
        Set<String> urlSet = analyzeHtml(html, "(?<=(href=\\\"))(?:[\\w.\\/\\:\\?\\=\\&]+)(?=\\\")");
        saveToFile(urlSet);
        System.out.println();
    }

    private String downloadHtml(String url, String charset) throws IOException {
        URL readUrl = new URL(url);
        BufferedReader reader = new BufferedReader(new InputStreamReader(readUrl.openStream(), charset));
        return CharStreams.toString(reader);
    }

    private Set<String> analyzeHtml(String html, String regex) {

        Set<String> urlSet = new HashSet<>();
        // 匹配url的正则表达式
        Matcher matcher = Pattern.compile(regex).matcher(html);
        while (matcher.find()) {
            String group = matcher.group();
            urlSet.add(group);
        }

        return urlSet;
    }

    private void saveToFile(Set<String> urlSet) throws IOException {
        PrintStream printer = new PrintStream(new FileOutputStream(FILE_PATH));
        for (String url : urlSet) {
            printer.println(url);
        }
        printer.flush();
        printer.close();
    }
}

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值