1 . 使用java自带的类
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class T {
public static void main(String[] args) {
String str = "<html>adfad</html><html>chen</html>";
String regex = "<html>([^<]+)</html>";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
while (matcher.find())
System.out.println(matcher.toMatchResult().group(1));
/*if (matcher.matches())
System.out.println(matcher.toMatchResult().group(1));*/
}
}
注意:matcher.find() 能够找出下一个匹配的文本,它查找与该模式匹配的输入序列的下一个子序列。
matcher.matches() 尝试将整个区域与模式匹配,如果字符串中包含多个匹配文本时,它一个都找不到。
2. 使用 org.apache.oro.text.regex.Perl5Matcher
import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import org.apache.oro.text.regex.MalformedPatternException;
import org.apache.oro.text.regex.Pattern;
import org.apache.oro.text.regex.PatternCompiler;
import org.apache.oro.text.regex.PatternMatcher;
import org.apache.oro.text.regex.PatternMatcherInput;
import org.apache.oro.text.regex.Perl5Compiler;
import org.apache.oro.text.regex.Perl5Matcher;
import au.id.jericho.lib.html.Source;
public class ParseTime {
public static void main(String[] args) throws MalformedURLException, IOException, MalformedPatternException {
String regex = "(\\d{4}[年|-]\\d{1,2}[月|-]\\d{1,2}[日]?)";
String str = new Source(new URL("file:/home/serverc/test/yw.shtml")).toString();
PatternCompiler compiler = new Perl5Compiler();
PatternMatcher matcher = new Perl5Matcher();
PatternMatcherInput input = new PatternMatcherInput(str);
Pattern pattern = compiler.compile(regex);
if(matcher.contains(input, pattern)){ //将if改成while就会找出所有匹配文本
System.out.println(matcher.getMatch().group(1));
}
}
}
注意:matcher.contains(input, pattern)相当于java中的matcher.find()
3. 匹配<x>..</x> 模式
String s = "<title>The</title>";
String regex = "<\\b(\\w+)>\\w*</\\1\\b>";
System.out.println(s.matches(regex));
4. Pattern p = Pattern.compile(regex,Pattern.CASE_INSENSITIVE); //设置对大小写不敏感(即不区分大小写)
Pattern p = Pattern.compile(regex,Pattern); //区分大小写
5. 例子
/**
* 该方法是判断一个字符串是不是一个合法的E-Mail地址
* 使用了正则表达式的方法
* 如果符合E-mail的格式,则返回 true, 否则返回 false ;
* E-mail 正确的格式是 XXX@XXX.XXX(.XXX) ;
* @param checkString 要判断的是否符合E-mail 格式的字符串
* @return 返回判断的结果,如果符合,返回 true, 否则返回 false ;
*/
public static boolean isEmail(String checkString){
//String regString="([a-zA-Z_0-9]+)@([a-zA-Z0-9]+).*(\\.com|\\.cn|\\.net)";
String regString="([a-zA-Z_0-9]+)@([a-zA-Z0-9]+)\\.([a-zA-Z]+)";
//String regString="\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.[a-zA-Z]+";
Pattern pattern=Pattern.compile(regString);
Matcher matcher=pattern.matcher(checkString);
return matcher.find();
}
/**
* 该方法是判断一个字符串是不是一个合法的URL地址
* 使用了正则表达式的方法
* 如果符合URL的格式,则返回 true, 否则返回 false ;
* URL 正确的格式是 http://XXX.XXX(XXX/XXX%&=XXX) ;
* @param checkString 要判断的是否符合 URL 格式的字符串
* @return 返回判断的结果,如果符合,返回 true, 否则返回 false ;
*/
public static boolean isURL(String checkString){
String regString="http://([\\w-]+\\.)+[\\w-]+(/[\\w- ./?%&=]*)?";
Pattern pattern=Pattern.compile(regString);
Matcher matcher=pattern.matcher(checkString);
return matcher.find();
}
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class T {
public static void main(String[] args) {
String str = "<html>adfad</html><html>chen</html>";
String regex = "<html>([^<]+)</html>";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
while (matcher.find())
System.out.println(matcher.toMatchResult().group(1));
/*if (matcher.matches())
System.out.println(matcher.toMatchResult().group(1));*/
}
}
注意:matcher.find() 能够找出下一个匹配的文本,它查找与该模式匹配的输入序列的下一个子序列。
matcher.matches() 尝试将整个区域与模式匹配,如果字符串中包含多个匹配文本时,它一个都找不到。
2. 使用 org.apache.oro.text.regex.Perl5Matcher
import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import org.apache.oro.text.regex.MalformedPatternException;
import org.apache.oro.text.regex.Pattern;
import org.apache.oro.text.regex.PatternCompiler;
import org.apache.oro.text.regex.PatternMatcher;
import org.apache.oro.text.regex.PatternMatcherInput;
import org.apache.oro.text.regex.Perl5Compiler;
import org.apache.oro.text.regex.Perl5Matcher;
import au.id.jericho.lib.html.Source;
public class ParseTime {
public static void main(String[] args) throws MalformedURLException, IOException, MalformedPatternException {
String regex = "(\\d{4}[年|-]\\d{1,2}[月|-]\\d{1,2}[日]?)";
String str = new Source(new URL("file:/home/serverc/test/yw.shtml")).toString();
PatternCompiler compiler = new Perl5Compiler();
PatternMatcher matcher = new Perl5Matcher();
PatternMatcherInput input = new PatternMatcherInput(str);
Pattern pattern = compiler.compile(regex);
if(matcher.contains(input, pattern)){ //将if改成while就会找出所有匹配文本
System.out.println(matcher.getMatch().group(1));
}
}
}
注意:matcher.contains(input, pattern)相当于java中的matcher.find()
3. 匹配<x>..</x> 模式
String s = "<title>The</title>";
String regex = "<\\b(\\w+)>\\w*</\\1\\b>";
System.out.println(s.matches(regex));
4. Pattern p = Pattern.compile(regex,Pattern.CASE_INSENSITIVE); //设置对大小写不敏感(即不区分大小写)
Pattern p = Pattern.compile(regex,Pattern); //区分大小写
5. 例子
/**
* 该方法是判断一个字符串是不是一个合法的E-Mail地址
* 使用了正则表达式的方法
* 如果符合E-mail的格式,则返回 true, 否则返回 false ;
* E-mail 正确的格式是 XXX@XXX.XXX(.XXX) ;
* @param checkString 要判断的是否符合E-mail 格式的字符串
* @return 返回判断的结果,如果符合,返回 true, 否则返回 false ;
*/
public static boolean isEmail(String checkString){
//String regString="([a-zA-Z_0-9]+)@([a-zA-Z0-9]+).*(\\.com|\\.cn|\\.net)";
String regString="([a-zA-Z_0-9]+)@([a-zA-Z0-9]+)\\.([a-zA-Z]+)";
//String regString="\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.[a-zA-Z]+";
Pattern pattern=Pattern.compile(regString);
Matcher matcher=pattern.matcher(checkString);
return matcher.find();
}
/**
* 该方法是判断一个字符串是不是一个合法的URL地址
* 使用了正则表达式的方法
* 如果符合URL的格式,则返回 true, 否则返回 false ;
* URL 正确的格式是 http://XXX.XXX(XXX/XXX%&=XXX) ;
* @param checkString 要判断的是否符合 URL 格式的字符串
* @return 返回判断的结果,如果符合,返回 true, 否则返回 false ;
*/
public static boolean isURL(String checkString){
String regString="http://([\\w-]+\\.)+[\\w-]+(/[\\w- ./?%&=]*)?";
Pattern pattern=Pattern.compile(regString);
Matcher matcher=pattern.matcher(checkString);
return matcher.find();
}