正则表达式

韩顺平 零基础30天学会Java

一、快速入门

  • 提取文章中所有的英文单词
  • 提取文章中所有的数字
  • 提取文章中所有的英文单词和数字
  • 提取百度热榜标题
package com.hspedu.chapter27.regexp;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @author 易
 * @version 1.0
 * 体验正则表达式
 */
public class Regexp {
    public static void main(String[] args) {
        String content = "好的,以下是一段包括中文、英文和数字的话:\n" +
                "\n" +
                "在21世纪的今天,随着科技的飞速发展,我们生活的世界变得越来越多元化。" +
                "我热衷于学习英语,尤其是口语交流,因为这有助于我更好地融入全球化的世界。" +
                "每天,我都会花费至少一个小时的时间来练习英语口语,努力提高自己的语言水平。" +
                "同时,我也对数学充满了兴趣,尤其是在解决复杂的数学问题时,我会感到无比的兴奋和满足。" +
                "数学让我学会了逻辑思维和解决问题的能力,也让我更加自信地面对未来的挑战。\n" +
                "\n" +
                "In the 21st century, with the rapid development of technology,";
        //先创建一个Pattern对象,模式对象,可以理解成就是一个正则表达式对象
//        Pattern pattern = Pattern.compile("[a-zA-Z]+");//找单词
//        Pattern pattern = Pattern.compile("[0-9]+");//找数字
        Pattern pattern = Pattern.compile("([0-9]+)|([a-zA-Z]+)");//找字母和数字
//        Pattern pattern = Pattern.compile("<a target=\"_b lank\" title=\"(\\S*)\"");//提取百度热榜标题
        //注意百度热榜标题需要使用group(1)取,才能取到
        //创建一个匹配器对象
        //就是matcher匹配器按照pattern(模式/样式),到content文本中取匹配,找到就返回true,未找到就返回false
        Matcher matcher = pattern.matcher(content);
        //开始循环匹配
        while (matcher.find()) {
            //匹配内容,文本,放到m.group(0)
            System.out.println("找到:" + matcher.group(0));
        }

    }
}

二、正则表达式基本语法

1、正则表达式基本介绍

  • 一个正则表达式,就是用某种模式去匹配字符串的一个公式
  • 很多编程语言都支持正则表达式进行字符串操作
  • 当正则表达式中出现小括号()的时候,就代表分组,第1个小括号()就是第1组;第2个小括号,就是第2组。

三、正则表达式三个常用类

1、pattern

  • pattern对象是一个正则表达式对象。Pattern 类没有公共构造方法。要创建一个Pattern对象,调用其公共静态方法 compile(),返回一个Pattern对象,该方法接收一个正则表达式作为他的第一个参数

2、Matcher

  • Matcher 对象是对输入字符串进行解释和匹配的引擎,没有公共构造方法,需要调用Pattern的matcher方法来获得一个Matcher对象

3、PatternSyntaxException

  • PatternSyntaxException 是一个非强制异常类,表示一个正则表达式模式中的语法错误

四、分组,捕获,反向引用

分组

在这里插入图片描述

反向引用符

  • 反向引用:圆括号的内容被捕获之后,可以在这个括号后背使用,从而写出一个比较使用的匹配模式,这个我们称为反向引用,这种引用既可以是在正则表达式内部,也可以是在正则表达式外部,内部反向引用**\分组号**,外部反向引用**$分组号**
@Test
    public void test06(){
        String content="12321-333999111";
        String regStr="^\\d{5}-(\\d)\\1{2}(\\d)\\2{2}(\\d)\\3{2}$";
        Pattern pattern = Pattern.compile(regStr);
        Matcher matcher = pattern.matcher(content);
        if(matcher.find()){
            System.out.println("满足格式");
        }else{
            System.out.println("不满足");
        }
    }

五、元字符

  • 转移号 \ 在我们是用正则表达式去检索某些特殊字符的时候,需要用到转移符号,否则检索不到结果,甚至会报错
  • 想要学会使用正则表达式必须理解元字符
  • 需要用到转义符的字符: . * + () $ / \ ? [] ^ {}

1、限定符

  • 用于指定其前面的字符和组合项连续出现多少次
    在这里插入图片描述
  • ?跟在任何一个限定符之后表示非贪婪匹配

2、选择匹配符

  • 在匹配某个字符的时候是选择性的,即可以匹配这个又可以匹配那个,这是需要用到选择匹配符号 |
    在这里插入图片描述

3、字符匹配符

在这里插入图片描述

java正则表达式默认是区分大小写的,如何不区分大小写

  • (?i)abc 表示 abc 都不区分大小写
  • a(?i)bc 表示bc不区分大小写
  • a((?i)b)c 表示只有b不区分大小写
  • Pattern pattern = Pattern.compile(regStr,Pattern.CASE_INSENSITIVE);参数Pattern.CASE_INSENSITIVE 代表不区分大小写
  • \s 匹配任何空白字符(空格、制表符等)
  • \S 匹配任何非空白字符和 \s 正好相反

4、定位符

  • 规定要匹配的字符串出现的位置,比如在字符串的开始还是结束位置
    在这里插入图片描述

六、String类中使用正则表达式

1、替换功能

public String replaceAll(String regex,String replacement)
@Test
    public void test07(){
        //将下面句子中的1998替换成1999
        String content="1998年12月8日,第二代Java平台的企业版J2EE发布。1999年6月,Sun公司发布了\" +\n" +
                "                \"第二代Java平台(简称为Java2)的3个版本:";
        content=content.replaceAll("1998","1999");
        System.out.println(content);
    }

2、判断功能

 public boolean matches(String regex)
@Test
    public void test08(){
        //验证一个手机号,必须是138或者是139开头的
        String content="13678920463";
        System.out.println(content.matches("13(8|9)\\d{8}"));
    }

3、分割功能

 public String[] split(String regex)
@Test
    public void test09(){
        //要求按照#或者-或者~或者数字来分割下面一句话
        String content="hello#abc-jack12smith~北京";
        String[] split = content.split("#|~|\\d+|-");
        for (String  s :split) {
            System.out.println(s);
        }
  • 16
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值