JAVA正则表达式基础入门

原创 2013年12月04日 09:51:36

 

/*
 * 这个类主要是为了解决正则表达式基础入门
 */
public class Test {

	public static void main(String[] args) {
		
		//.代表任意的一个字符(与行结束符可能匹配也可能不匹配)
		p("abc".matches("..."));
		//将数字替换为“-”,\d表示一个数字
		p("a8729a".replaceAll("\\d", "-"));
		//取值范围为a到z之间的所有字符,长度只有3
		Pattern p = Pattern.compile("[a-z]{3}");
		Matcher m = p.matcher("fgh");
		p(m.matches());
		//上面三句代码和下面一句代码意思是一致的
		p("fgha".matches("[a-z]{3}"));
		
		/*
		//初步认识. * + ?
		//.代表任意的一个字符
		p("a".matches("."));
		p("aa".matches("aa"));
		//*代表0个或者是多个,前面必须有字符,不能单独使用,“a*”表示0个或者多个a
		p("aaaa".matches("a*"));
		//+代表1个或者是多个,前面必须有字符,不能单独使用,“a+”表示1个或者多个a
		p("aaaa".matches("a+"));
		p("".matches("a*"));//true
		//?表示0个或者是1个,前面必须有字符,不能单独使用,“a?”表示0个或是1个a
		p("aaaa".matches("a?"));//false
		p("".matches("a?"));
		p("a".matches("a?"));
		//\d{3,100}表示至少有3个数字,至多有100个数字,{}表示匹配的字符的数量
		p("214523145234532".matches("\\d{3,100}"));
		p("192.168.0.aaa".matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}"));
		//[0-2][0-9][0-9]匹配第一个数字范围在0到2之间,第二个在0到9之间,第三个在0到9之间
		p("192".matches("[0-2][0-9][0-9]"));
		*/
		
		/*
		//[]表示范围
		p("a".matches("[abc]"));
		//^表示除开[]里面以外的字符
		//[^abc]表示abc以外的字符
		p("a".matches("[^abc]"));
		//下面三个都是a-z和A-Z,取两者的并集,只是三种不同的写法
		p("A".matches("[a-zA-Z]"));
		p("A".matches("[a-z]|[A-Z]"));
		p("A".matches("[a-z[A-Z]]"));
		//范围是A到Z并且是RFG,也就是说的取交集
		p("R".matches("[A-Z&&[RFG]]"));
		*/ 

		//认识\s \w \d \
		/*
		 * \s表示空白字符
		 * \w表示单词字符
		 * \d表示数字
		 * 上面的字母大写就表示小写的取反
		*/
		/*
		p(" \n\r\t".matches("\\s{4}"));
		p(" ".matches("\\S"));
		p("a_8".matches("\\w{3}"));
		p("abc888&^%".matches("[a-z]{1,3}\\d+[&^#%]+"));
		p("\\".matches("\\\\"));
		*/
		
		//边界匹配
		/*
		//^表示行的开头,"^he.*"表示是以he开头,而不仅仅是针对h开头
		p("hello sir".matches("^he.*"));
		p("hillo sir".matches("^he.*"));
		//$行的结尾,".*ir$"表示是以ir结尾,而不仅仅是针对r结尾
		p("hello sdr".matches(".*ir$"));
		p("hello sir".matches(".*ir$"));
		//\b表示的是单词边界,\B表示的是非单词边界
		p("hello sir".matches("^h[a-z]{1,3}o\\b.*"));
		p("hellosir".matches("^h[a-z]{1,3}o\\b.*"));
		p("hellosir".matches("^h[a-z]{1,3}o\\B.*"));
		//whilte lines
		p(" \n".matches("^[\\s&&[^\\n]]*\\n$"));
		p("aaa 8888c".matches(".*\\d{4}."));
		p("aaa 8888c".matches(".*\\b\\d{4}."));
		p("aaa8888c".matches(".*\\d{4}."));
		p("aaa8888c".matches(".*\\b\\d{4}."));
		*/
		
		//email
		//p("asdfasdfsafsf@dsdfsdf.com".matches("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+"));
		
		/*
		//matches()方法和find()方法相互影像 
		Pattern p = Pattern.compile("\\d{3,5}");
		String s = "123-34345-234-00";
		Matcher m = p.matcher(s);
		//matches()方法会匹配所有的字符串,和\d{3,5}表达式去匹配,明显是不符合的
		p(m.matches());//false
		//如果不使用reset()方法,则匹配的字符串从34345-234-00开始,因为之前的123-被前面的matches()方法匹配了
		m.reset();
		//find()方法找子字符串,在这里必须先使用,不然后面的start()和end()方法不能正常使用
		p(m.find());
		p(m.start() + "-" + m.end());
		p(m.find());
		p(m.start() + "-" + m.end());
		p(m.find());
		p(m.start() + "-" + m.end());
		p(m.find());
		//如果没有使用上面的reset()方法,则使用下面的语句会抛异常
		//p(m.start() + "-" + m.end());
		
		//lookingAt()尝试将从区域开头开始的输入序列与该模式匹配。因此下面的四个输出总是true
		p(m.lookingAt());
		p(m.lookingAt());
		p(m.lookingAt());
		p(m.lookingAt());
		*/
 
		//replacement
		//Pattern.CASE_INSENSITIVE表示匹配不区分大小写,将偶数java全部设为大写
		/*
		Pattern p = Pattern.compile("java", Pattern.CASE_INSENSITIVE);
		Matcher m = p.matcher("java Java JAVa JaVa IloveJAVA you hateJava afasdfasdf");
		StringBuffer buf = new StringBuffer();
		int i=0;
		while(m.find()) {
			i++;
			if(i%2 == 0) {
				m.appendReplacement(buf, "java");
			} else {
				m.appendReplacement(buf, "JAVA");
			}
		}
		m.appendTail(buf);
		p(buf);
		*/
		
		//group
		//(\\d{3,5})([a-z]{2})表达式分了三组,第一组是整体匹配,为第0组,(\\d{3,5})为第1组,([a-z]{2})为第二组
		/*
		Pattern p = Pattern.compile("(\\d{3,5})([a-z]{2})");
		String s = "123aa-34345bb-234cc-00";
		Matcher m = p.matcher(s);
		//这里只有使用了find()方法,才能使用group()方法,不然会抛异常
		while(m.find()) {
			p(m.group());
		}
		System.out.println("找出只满足上面正则表达式其中一部分的情况——分组");
		System.out.println("匹配(\\d{3,5})");
		m.reset();
		while(m.find()) {
			//显示的是第一个括号的分组
			p(m.group(1));
		}
		System.out.println("匹配([a-z]{2})");
		m.reset();
		while(m.find()) {
			//显示的是第一个括号的分组
			p(m.group(2));
		}
		*/
		
		//qulifiers
		/*
		 * (.{3,10}?)表示的是Reluctant(不情愿的)匹配模式,会从最少的去匹配,即3个开始,如果不匹配会逐步增加匹配数量
		 * (.{3,10}+)表示的是Possessive(独占的)匹配模式,会直接匹配最大的数量,即10个,但是不会往少了去匹配,这种方式效率比较高
		 * 如果s = "aaaa5bbbb65"这样就能和+独占匹配方式匹配了
		 * (.{3,10})表示的是greedy(贪婪的)匹配模式,会直接匹配最大的数量,如果不匹配,会自动的往数量小的地方去匹配
		 */
		/*
		Pattern p = Pattern.compile("(.{3,10}+)[0-9]");
//		Pattern p = Pattern.compile("(.{3,10}?)[0-9]");
//		Pattern p = Pattern.compile("(.{3,10})[0-9]");
		String s = "aaaa5bbbb6";
		Matcher m = p.matcher(s);
		if(m.find()){
			p(m.group());
			p(m.start() + "-" + m.end());
		}
		else 
			p("not match!");
		*/
		
		//non-capturing groups
		/*
		//表示最后一个字符为a,且a不被捕获
		Pattern p = Pattern.compile(".{3}(?=a)");
		String s = "444a66b";
		Matcher m = p.matcher(s);
		while(m.find()) {
			p(m.group());
		}
		*/
	}	
	
	public static void p(Object o) {
		System.out.println(o);
	}

}
 

 

相关文章推荐

Java正则表达式入门基础篇

正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为...
  • ryelqy
  • ryelqy
  • 2017年07月24日 19:57
  • 78

java 从零开始,学习笔记之基础入门<正则表达式>(三十一)

正则表达式 JAVA中正则表达式: ² [a-z]表示字母a到z任意一个字符 ² [A-Z]表示A到Z任意一个字符 ² [0-9]表示数字0到9中任意一个数字 ² //"^"表示以某个字符开...
  • lulu147
  • lulu147
  • 2013年12月06日 10:21
  • 1624

java基础巩固系列(十二):java正则表达式入门以及Pattern、Matcher类详解

一、正则表达式入门 1、定义:正则表达式使用单个字符串来描述、匹配一系列符合某个语法规则的字符串,由特定的字符组合而成。 2、用途:字符串的查找、匹配、替换、分割 3、实现类: java.util.r...

【Java基础】Java正则表达式入门

一:什么是正则表达式     1.定义:正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描...

深入入门正则表达式(java) - 1 - 入门基础

1.元字符 很多人对正则表达式的印象就是乱码。。许许多多的符号组合在一起,偶见单词,正则确实是这样的,所以下面我们要看看这些符号都是什么意思 有些符号不是大家看到的字面上的意思:比如“.”、“...

js正则表达式基础入门

  • 2009年01月16日 11:25
  • 1015KB
  • 下载

正则表达式入门基础知识

  • 2008年11月17日 09:09
  • 181KB
  • 下载

javascript 正则表达式入门基础—由浅入深

javascript 正则表达式 //javascript正则表达式的基本知识 //声明javascript 正则表达式 var reCat = ne...
  • a125138
  • a125138
  • 2012年08月11日 19:38
  • 2231

正则表达式基础入门

  • 2013年01月17日 16:08
  • 1.34MB
  • 下载

Java正则表达式入门介绍课件

  • 2009年01月05日 23:28
  • 504KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:JAVA正则表达式基础入门
举报原因:
原因补充:

(最多只允许输入30个字)