Java正则表达式pattern和matcher
Pattern
提供一个正则表达式编译之后的表现模式
常用定义方法及使用:
1. Pattern p = Pattern.compile(“ String s”) //Stirng s 为正则表达式;
2. Matcher m=p.matcher(input) //input 为string 类型,是想用正则表达式去匹配的对象字符串;
3. String [ ] split(charSequence s) // p.split(“ agfdg”)为将字符串s根据正则表达式所表示的字符进行分割
Matcher
是一个状态机器,以Pattern对象为匹配模式做模式匹配
常用方法及使用:
1. 定义 Matcher m= p.matcher( input) //定义了一个Matcher对象;
2. Boolean res=m.find( ) //尝试寻找匹配字符串,若找到返回true ;
3. String replaceAll(String replacement)
//将目标字符串里与既有模式相匹配的子串全部替换为指定的字符串。
4. String replaceFirst(String replacement)
//将目标字符串里第一个与既有模式相匹配的子串替换为指定的字符串。
5. m.appendReplacement(StringBuffer sb , String s)
//sb 为想要添加进去的字符串 ,s为替换匹配字符串的字符串
6. m.appendTail( StringBuffer sb)
//将最后一次匹配工作后剩余的字符串加入sb
一个检验email地址的小程序
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public static void main(String[] args) throws Exception {
String input = "cgjail%$#@163.net";
Pattern p = Pattern.compile("^.|^@");
Matcher m = p.matcher(input);
Boolean res=m.find();
if (res)
// 检测是否以"www."为起始
p = Pattern.compile("^www.");
m = p.matcher(input);
if (res)
// 检测是否包含非法字符
p = Pattern.compile("[^A-Za-z0-9.@_-~]+");
m = p.matcher(input);
StringBuffer sb = new StringBuffer();
boolean result = m.find();
boolean deletedIllegalChars = false;
while (result) {
// 如果找到了非法字符那么就设下标记
deletedIllegalChars = true;
// 如果里面包含非法字符如冒号双引号等,那么就把他们消去,加到SB里面
m.appendReplacement(sb, "");
result = m.find();
}
m.appendTail(sb);
input = sb.toString();
if (deletedIllegalChars) {
System.out.println("输入的EMAIL地址里包含有冒号、逗号等非法字符,请修改");
System.out.println("修改后合法的地址应类似: " + input);
}
}
}