正则表达式:
正则表达式是用于专门操作字符串
好处:可以简化对字符串的复杂操作
特点:用于一些特定的符号来表示一些代码操作,这样就简化书写
弊端:符合定义越多,正则越长,阅读性越差
注意事项:
1.用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false
2.正则表达式中反斜线成对出现
字符类
[abc] a、b 或c(简单类) 只能是abc中的一个
[^abc] 任何字符,除了 a、b或 c(否定)
[a-zA-Z] a 到 z 或A 到 Z,两头的字母包括在内(范围)
[a-d[m-p]] a 到 d 或m 到 p:[a-dm-p](并集)
[a-z&&[def]] d、e或 f(交集)
[a-z&&[^bc]] a 到z,除了 b 和 c:[ad-z](减去)
[a-z&&[^m-p]] a 到z,而非 m 到 p:[a-lq-z](减去)
预定义字符类
任何字符(与行结束符可能匹配也可能不匹配)
\d 数字:[0-9]
\D 非数字: [^0-9]
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 单词字符:[a-zA-Z_0-9]
\W 非单词字符:[^\w]
数量词
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超过 m 次
边界匹配器
^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾,仅用于最后的结束符(如果有的话)
\z 输入的结尾
\\d? 表示一个数字或者没有数字
组的作用:
为了可以让规则的结果被重用,可以将规则封装成一个组。用()完成,组的出现都有编号,从1开始,想要使用一样的组可以通过\n(n就是组的编号)的形式来获取 有几个组括号就有几组。
正则中的方法
1,匹配:String matches方法。用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false。
matches(String regex) 告知此字符串是否匹配给定的正则表达式。
2,切割:String split();
split(String regex, int limit)
根据匹配给定的正则表达式来拆分此字符串。
3,替换:String replaceAll(regex,str);如果regex中有定义组,可以在第二参数中通过$符号获取正则表达式中的已有的组
replaceAll(String regex, Stringreplacement)
使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
4,获取:将字符串中的符合规则的子串取出
示例:
1,将正则表达式封装成对象。
Pattern p =Pattern.compile(reg);
compile(String regex)
将给定的正则表达式编译到模式中。
2,让正则对象和要操作的字符串相关联。
Matcher m = p.matcher(str);
matcher(CharSequence input)
创建匹配给定输入与此模式的匹配器。
3,关联后,获取正则匹配引擎。
4,通过引擎对符合规则的子串进行操作,比如取出
while(m.find())
{
System.out.println(m.group());
System.out.println(m.start()+"...." +m.end());
}
------ Java培训、Android培训、iOS培训、.Net培训、期待与您交流! -------