------Java培训、Android培训、iOS培训、.Net培训、期待与您交流! -------
正则表达式的基础知识
(1)就是符合一定规则的字符串
(2)常见规则
A:字符
x 字符 x。举例:'a'表示字符a
\\ 反斜线字符。
\n 新行(换行)符 ('\u000A')
\r 回车符 ('\u000D')
B:字符类
[abc] a、b 或 c(简单类)
[^abc] 任何字符,除了 a、b 或 c(否定)
[a-zA-Z] a到 z 或 A到 Z,两头的字母包括在内(范围)
[0-9] 0到9的字符都包括
C:预定义字符类
. 任何字符。我的就是.字符本身,怎么表示呢? \.
\d 数字:[0-9]
\w 单词字符:[a-zA-Z_0-9]
在正则表达式里面组成单词的东西必须有这些东西组成
D:边界匹配器
^ 行的开头
$ 行的结尾
\b 单词边界
就是不是单词字符的地方。
举例:hello world?haha;xixi
E:Greedy 数量词
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超过 m 次
(3)常见功能:(分别用的是谁呢?)
A:判断功能
String类的public boolean matches(String regex)
B:分割功能
String类的public String[] split(String regex)
C:替换功能
String类的public String replaceAll(String regex,String replacement)
D:获取功能
Pattern和Matcher
Pattern p = Pattern.compile("a*b");
Matcher m = p.matcher("aaaaab");
find():查找存不存在
group():获取刚才查找过的数据
特殊表示法:表示5个连续的数字
(\\d)\\1{4}
案例:获取字符串中由3个字符组成的单词
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/*
* 获取功能:
* 获取下面这个字符串中由三个字符组成的单词
* da jia ting wo shuo,jin tian yao xia yu,bu shang wan zi xi,gao xing bu?
* Pattern p =Pattern.compile(regex);通过传递规则作为参数来创建模式对象
* Matcher m = p.matcher(s);通过模式对象的matcher方法存放匹配的字符串来得到匹配器对象
* 匹配器对象的获取方法:
* public boolean find()查找存不存在
* public String group()获取刚才查找过的数据,所以必须先查找否则获取不到
*/
public class GetRegex {
public static void main(String[] args) {
//定义一个字符串
String s = "da jia ting wo shuo,jin tian yao xia yu,bu shang wan zi xi,gao xing bu?";
//创建规则
String regex = "\\b\\w{3}\\b";<span style="white-space:pre"> </span>//因为有空格,所以使用\b单词边界来限定
//创建模式对象
Pattern p =Pattern.compile(regex);
//通过模式对象得到匹配器对象,存放被匹配的字符串
Matcher m = p.matcher(s);
/*//判断是否有匹配
boolean flag = m.find();
System.out.println(flag);
//只有再判断后才可以获取
String s2 = m.group();
System.out.println(s2);*/
//这个判断的顺序是从前向后执行,每得到一个正确结果就会停止,判断,等待下次命令再继续执行。
//使用循环
while(m.find()){
System.out.println(m.group());
}
}
}