Java学习笔记6 正则表达式

学习Java的普通网友

已于 2022-07-20 14:07:48 修改

阅读量111

点赞数

分类专栏： Java基础文章标签：正则表达式学习

于 2022-07-20 14:06:19 首次发布

本文链接：https://blog.csdn.net/daochutoudaima/article/details/125891061

版权

Java基础专栏收录该内容

13 篇文章 0 订阅

订阅专栏

正则表达式

是一种对字符串进行匹配、检索、和替换的一种规则
正则匹配数据的效果非常高、可读性很差

精确匹配

xyz : 匹配字符串中的 xyz

元字符匹配

[xyz] : 匹配 x, y, z 中的任意一个字母
[a-z] : 匹配 a 到 z 之间的任意一个字母
[0-9] : 匹配 0 ~ 9 之间的任意一个数字
[.] 或者 . : 匹配一个小数点
[^0-9] : 匹配非数字
\d : 匹配一个数字、等价于 [0-9]
\D : 匹配一个非数字、等价于 [^0-9]
\w : 匹配字母、数字、下划线、等价于 [a-zA-Z0-9_]
\W : 对 \w 取反
[\D\d] : 匹配所有的任意一个字符
\s : 匹配空白字符(空格、制表符、换行符)
\S : 对 \s 取反
. : 匹配除换行符之外的任意一个字符

多字符匹配

X{n} : 匹配 n 个 X 匹配的内容
X{n,} : 匹配至少 n个 X 匹配的内容
X{n,m} : 匹配 n ~ m 个 X 匹配的内容， n <= m

X代表元字符匹配规则

贪婪式表达式

X* : 匹配 0 ~ N 个 X 匹配的内容，等价于 {0,}
X+ : 匹配 1 ~ N 个 X 匹配的内容，等价于 {1,}
X? : 匹配 0 ~ 1 个 X 匹配的内容，等价于 {0,1}

非贪婪式表达式

在贪婪式表达式的后面，添加一个 ? 就变成了非贪婪式表达式

X*? : 匹配 0 ~ N 个 X 匹配的内容
X+? : 匹配 1 ~ N 个 X 匹配的内容
X?? : 匹配 0 ~ 1 个 X 匹配的内容

非贪婪式表达式，一般需要和后面的表达式配合完成匹配
非贪婪式表达式一般不会出现在正则的尾部

分组(regex)

对正则表达式使用小括号进行分组
作用是用来将整个正则表达式匹配的内容中具有价值或者关注的数据进行单独分组标记、以便后续的数据提取
分组的顺序：以左括号为主来标记组的顺序

命名捕获分组 `(?<name>regex)`

给组设置一个名称、方便程序根据名字获取组匹配的内容
?<name> : 给组设置一个名称
不可的语言对他语法可能会不一样，例如 Python的语法式 (?P<name>regex)

非捕获分组 (?:regex)

当使用小括号的时候，正则表达式会产生分组效果，如果此时不希望小括号作为一个组，那么可以在括号里添加 ?:

引用分组 \n

n 代表组的编号
通过引用某一个组匹配的内容，来进行匹配
常用来解决对称匹配问题

选择 `|`

对一个整体进行或运算

限定符

一般用来做数据校验，用来校验字符串是否匹配内容

^ : 以 … 开头，位置写在正则表达式所有匹配规则的前面
$ : 以 … 结尾，位置写在正则表达式所有匹配规则的后面

断言

反向确定断言 (?<=)
反向否定断言 (?<!)
正向确定断言 (?=)
正向否定断言 (?!)

Java中使用正则表达式

在 Java 语言中，正则表达式使用字符串的形式来表示
表示正则表达式的类是 java.util.regex.Pattern 类

将字符串格式的正则表达式转成Pattern对象


Pattern p = Pattern.compile(regex) ; 

Matcher  m  = p.matcher(str) 

m.matches() :  会自动在正则前后加上限定符^$, 用来匹配整个字符串，一般用来做数据校验 

m.find() : 会根据正则表达式，从字符串中查找匹配的内容，如果找到，返回 true 

m.group() : 会提取正则表达式 匹配的内容，但该方法在使用前 必须先调用 m.find()

matches()

会自动在正则前后加上限定符^$, 用来匹配整个字符串，一般用来做数据校验

find() + group()

会根据正则表达式，从字符串中查找匹配的内容，并获取匹配的容器

group(n)

n 如果是数字，则代表提取正则第 n 组匹配的内容，如果是 0，代表获取正则匹配的内容

n 如果是字符串，则代表命名捕获分组中定义的组名

字符串替换

Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(s);
StringBuilder sb = new StringBuilder();

while (matcher.find()) {
    matcher.appendReplacement(sb, 'xxxxx');
}
matcher.appendTail(sb);