JAVA中如何查找文本中包含的网址

最新推荐文章于 2024-08-01 15:05:06 发布

jnn_dream

最新推荐文章于 2024-08-01 15:05:06 发布

阅读量1.1k

点赞数

分类专栏： JAVA 文章标签： java string 正则

本文链接：https://blog.csdn.net/qq_23491413/article/details/54916892

版权

JAVA 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

前言：今天做项目，有个需求，需要获取文本中包含的网址，于是开始百度记录。

解决思路： 匹配正则。目前只会网上搜索拿来用【简直是程序猿的耻辱，不能学我】

代码

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class URLMatcher {
    public static void main(String[] args) {
        Pattern pattern = Pattern
                .compile("(http://|ftp://|https://|www){0,1}[^\u4e00-\u9fa5\\s]*?\\.(com|net|cn|me|tw|fr)[^\u4e00-\u9fa5\\s]*");
        // 空格结束
        Matcher matcher = pattern
                .matcher("随碟附送下载地址http://www.zuidaima.com/sdfsdf.htm?aaaa=%ee%sss ?sdfsyyy空格结束");
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }

        // 中文结束
        matcher = pattern
                .matcher("随碟附送下载地址http://www.zuidaima.com/sdfsdf.htm?aaaa=%ee%sss网址结束");
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }

        // 没有http://开头
        matcher = pattern
                .matcher("随碟附送下载地址www.zuidaima.com/sdfsdf.htm?aaaa=%ee%sss网址结束");
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }

        // net域名
        matcher = pattern
                .matcher("随碟附送下载地址www.xxx.net/sdfsdf.htm?aaaa=%ee%sss网址结束");
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }

        // xxx域名
        matcher = pattern
                .matcher("随碟附送下载地址www.zuidaima.xxx/sdfsdf.htm?aaaa=%ee%sss网址结束");
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }

        // yyyy域名匹配不到
        System.out.println("匹配不到yyyy域名");
        matcher = pattern
                .matcher("随碟附送下载地址www.zuidaima.yyyy/sdfsdf.html?aaaa=%ee%sss网址结束");
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }

        // 没有http://www.
        matcher = pattern
                .matcher("随碟附送下载地址zuidaima.com/sdfsdf.html?aaaa=%ee%sss网址结束");
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }

    }
}

感谢博主

凡事多问为什么，一举反三，事半功倍！！！

jnn_dream

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
JAVA中如何查找文本中包含的网址

前言：今天做项目，有个需求，需要获取文本中包含的网址，于是开始百度记录。解决思路：匹配正则。目前只会网上搜索拿来用【简直是程序猿的耻辱，不能学我】代码import java.util.regex.Matcher;import java.util.regex.Pattern;public class URLMatcher { public static void main(String[]
复制链接

扫一扫

专栏目录