正则表达式:符合一定规则的表达式
作用:专门用于操作字符串
用一些特定的符号来表示一些代码操作,这样就简化书写,所以学习正则表达式就是在学习一些特殊符号的使用。
好处:可以简化对字符串的复杂操作
弊端:符号定义越多,正则越长,阅读性越差
具体操作功能:
1、 匹配:String matches方法,用规则匹配整个字符串,只要有一处不符合,就匹配结束,返回false
2、 切割:按照叠词完成切割,为了可以让规则的结果可以被重用,可以将规则封装成一个组,用()完成,组的出现都有编号,从一开始,想要使用已有的组可以通过\n(n就是租的编号)如:“(.)\\1+” ------按照任意多的叠词切
3、 替换:String replaceAll()
将重叠的字符替换成单个字符,$获取组的元素!
4、 获取:将字符串中符合规则的子串取出
操作步骤:
A、将正则表达式封装成对象
B、让正则对象和要操作的字符串相关联
C、关联后,获取正则匹配引擎
D、通过引擎对符合规则的子串进行操作,比如取出
获取的实例:
import java.util.regex.*;
class RegexDemo2
{
public static void main(String[] args)
{
getDemo();
}
public static void getDemo()
{
String str="ni hao ma ye xu ceng jing de ni yao hao yi xie !";
System.out.println(str);
String regex="\\b[a-zA-Z]{3}\\b";
Pattern p=Pattern.compile(regex);//将正则表达式封装成对象
Matcher m=p.matcher(str);//将正则对象和要操作的字符串相关联
while(m.find())
{
System.out.println(m.group());
System.out.println(m.start()+"----"+m.end());
}
}
}
正则表达式的构造摘要
构造 |
匹配 |
|
|
字符 |
|
x |
字符 x |
\\ |
反斜线字符 |
\0n |
带有八进制值 0 的字符 n (0 <= n <= 7) |
\0nn |
带有八进制值 0 的字符 nn (0 <= n <= 7) |
\0mnn |
带有八进制值 0 的字符 mnn(0 <= m <= 3、0 <= n <= 7) |
\xhh |
带有十六进制值 0x 的字符 hh |
\uhhhh |
带有十六进制值 0x 的字符 hhhh |
\t |
制表符 ('\u0009') |
\n |
新行(换行)符 ('\u000A') |
\r |
回车符 ('\u000D') |
\f |
换页符 ('\u000C') |
\a |
报警 (bell) 符 ('\u0007') |
\e |
转义符 ('\u001B') |
\cx |
对应于 x 的控制符 |
|
|
字符类 |
|
[abc] |
a、b 或 c(简单类) |
[^abc] |
任何字符,除了 a、b 或 c(否定) |
[a-zA-Z] |
a 到 z 或 A 到 Z,两头的字母包括在内(范围) |
[a-d[m-p]] |
a 到 d 或 m 到 p:[a-dm-p](并集) |
[a-z&&[def]] |
d、e 或 f(交集) |