正则表达式——(3)练习 去除重复字符、排序、校验邮箱

1、治口吃

将字符串中重复的字符变成不重复,去掉多余的字符

private static void test_1() {
        String str="我我...我我...我我我要...要要要要...要要要要..学学学学学...学学编编...编编编编..编..程程...程程...程程程";
        //1、将字符串中的"." 去掉。 使用正则\\.
        str= str.replaceAll("\\.", "");
        System.out.println(str);

        //2、取出重复字符
        str=str.replaceAll("(.)\\1+","$1");
        System.out.println(str);
    }

2、IP地址排序。

按照开头数字从小到大排序

    /**
     *  IP地址排序
     *  192.168.10.34
     *  127.0.0.1
     *  3.3.3.3
     *  105.70.11.55
     *
     *  开头数字小的在前面。
     *
     */
    private static void test_2() {
        String str="192.168.10.34 127.0.0.1 3.3.3.3  105.70.11.55";
        //1、为了让ip可以按照字符串顺序比较,只要让ip的每一段的位数相同。
        //所以,补零,按照每一位所需做多0进行补充。每一段都加两个0.
        str=str.replaceAll("(\\d+)","00$1");
        System.out.println(str);

        //2、然后每一段保留数字3位。
        //0或者任意数字保留三位,输出这三位
        str=str.replaceAll("0*(\\d{3})","$1");
        System.out.println(str);

        //3、将ip地址切出。
        String[] ips = str.split(" +");

        //4、将ip放入TreeSet中自动排序
        TreeSet<String> ts = new TreeSet<String>();
        for(String  ip : ips){
            ts.add(ip);
        }
        for(String ip : ts){
            //5、输出除去多余的0  将0开头的部分去除只留下纯数字的
            System.out.println(ip.replaceAll("0*(\\d+)", "$1"));
        }
    }

3、邮件地址校验


    /**
     * 校验邮箱地址
     */
    private static void test_3() {
        String mail="James@163.com";

        /**
         * [a-zA-Z0-9_]+ @符号前面的字符串有字母数组组成,出现一次或多次 一般为邮箱号正文
         * "@" 固定的邮箱@符号
         *  [a-zA-Z0-9_]+ 邮箱组织名可由字母数组下划线组成 一般为qq、163、123 等
         * \\. 固定分割副
         *  [a-zA-Z]{1,3} 机构类别 常见有 com、cn、edu等
         *  + 表示com等可多次出现
         */
        String regex="[a-zA-Z0-9_]+@[a-zA-Z0-9_]+(\\.[a-zA-Z]{1,3})+";
        boolean b = mail.matches(regex);
        System.out.println(mail+":"+b);
    }

 

4、爬虫

爬墙本地源文件中的邮箱

public static List<String>  getMails() throws IOException{

        //1,读取源文件。
        BufferedReader bufr = new BufferedReader(new FileReader("c:\\mail.html"));

        //2,对读取的数据进行规则的匹配。从中获取符合规则的数据.
        String mail_regex = "\\w+@\\w+(\\.\\w+)+";

        List<String> list = new ArrayList<String>();


        Pattern p = Pattern.compile(mail_regex);

        String line = null;

        while((line=bufr.readLine())!=null){

            Matcher m = p.matcher(line);
            while(m.find()){
                //3,将符合规则的数据存储到集合中。
                list.add(m.group());
            }

        }
        return list;

    }

 

2、爬取网络中网页中的邮箱

public static List<String> getMailsByWeb() throws IOException {

        //1,读取源文件。
        //BufferedReader bufr = new BufferedReader(new FileReader("c:\\mail.html"));

        URL url = new URL("http://192.168.1.100:8080/myweb/mail.html");

        BufferedReader bufIn = new BufferedReader(new InputStreamReader(url.openStream()));

        //2,对读取的数据进行规则的匹配。从中获取符合规则的数据.
        String mail_regex = "\\w+@\\w+(\\.\\w+)+";

        List<String> list = new ArrayList<String>();


        Pattern p = Pattern.compile(mail_regex);

        String line = null;

        while((line=bufIn.readLine())!=null){

            Matcher m = p.matcher(line);
            while(m.find()){
                //3,将符合规则的数据存储到集合中。
                list.add(m.group());
            }

        }
        return list;
    }

测试:

public static void main(String[] args) throws IOException {
        List<String> list = getMailsByWeb();

        for(String mail : list){
            System.out.println(mail);
        }
    }

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

真香号

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值