JAVA正则表达式基础入门

 

/*
 * 这个类主要是为了解决正则表达式基础入门
 */
public class Test {

	public static void main(String[] args) {
		
		//.代表任意的一个字符(与行结束符可能匹配也可能不匹配)
		p("abc".matches("..."));
		//将数字替换为“-”,\d表示一个数字
		p("a8729a".replaceAll("\\d", "-"));
		//取值范围为a到z之间的所有字符,长度只有3
		Pattern p = Pattern.compile("[a-z]{3}");
		Matcher m = p.matcher("fgh");
		p(m.matches());
		//上面三句代码和下面一句代码意思是一致的
		p("fgha".matches("[a-z]{3}"));
		
		/*
		//初步认识. * + ?
		//.代表任意的一个字符
		p("a".matches("."));
		p("aa".matches("aa"));
		//*代表0个或者是多个,前面必须有字符,不能单独使用,“a*”表示0个或者多个a
		p("aaaa".matches("a*"));
		//+代表1个或者是多个,前面必须有字符,不能单独使用,“a+”表示1个或者多个a
		p("aaaa".matches("a+"));
		p("".matches("a*"));//true
		//?表示0个或者是1个,前面必须有字符,不能单独使用,“a?”表示0个或是1个a
		p("aaaa".matches("a?"));//false
		p("".matches("a?"));
		p("a".matches("a?"));
		//\d{3,100}表示至少有3个数字,至多有100个数字,{}表示匹配的字符的数量
		p("214523145234532".matches("\\d{3,100}"));
		p("192.168.0.aaa".matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}"));
		//[0-2][0-9][0-9]匹配第一个数字范围在0到2之间,第二个在0到9之间,第三个在0到9之间
		p("192".matches("[0-2][0-9][0-9]"));
		*/
		
		/*
		//[]表示范围
		p("a".matches("[abc]"));
		//^表示除开[]里面以外的字符
		//[^abc]表示abc以外的字符
		p("a".matches("[^abc]"));
		//下面三个都是a-z和A-Z,取两者的并集,只是三种不同的写法
		p("A".matches("[a-zA-Z]"));
		p("A".matches("[a-z]|[A-Z]"));
		p("A".matches("[a-z[A-Z]]"));
		//范围是A到Z并且是RFG,也就是说的取交集
		p("R".matches("[A-Z&&[RFG]]"));
		*/ 

		//认识\s \w \d \
		/*
		 * \s表示空白字符
		 * \w表示单词字符
		 * \d表示数字
		 * 上面的字母大写就表示小写的取反
		*/
		/*
		p(" \n\r\t".matches("\\s{4}"));
		p(" ".matches("\\S"));
		p("a_8".matches("\\w{3}"));
		p("abc888&^%".matches("[a-z]{1,3}\\d+[&^#%]+"));
		p("\\".matches("\\\\"));
		*/
		
		//边界匹配
		/*
		//^表示行的开头,"^he.*"表示是以he开头,而不仅仅是针对h开头
		p("hello sir".matches("^he.*"));
		p("hillo sir".matches("^he.*"));
		//$行的结尾,".*ir$"表示是以ir结尾,而不仅仅是针对r结尾
		p("hello sdr".matches(".*ir$"));
		p("hello sir".matches(".*ir$"));
		//\b表示的是单词边界,\B表示的是非单词边界
		p("hello sir".matches("^h[a-z]{1,3}o\\b.*"));
		p("hellosir".matches("^h[a-z]{1,3}o\\b.*"));
		p("hellosir".matches("^h[a-z]{1,3}o\\B.*"));
		//whilte lines
		p(" \n".matches("^[\\s&&[^\\n]]*\\n$"));
		p("aaa 8888c".matches(".*\\d{4}."));
		p("aaa 8888c".matches(".*\\b\\d{4}."));
		p("aaa8888c".matches(".*\\d{4}."));
		p("aaa8888c".matches(".*\\b\\d{4}."));
		*/
		
		//email
		//p("asdfasdfsafsf@dsdfsdf.com".matches("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+"));
		
		/*
		//matches()方法和find()方法相互影像 
		Pattern p = Pattern.compile("\\d{3,5}");
		String s = "123-34345-234-00";
		Matcher m = p.matcher(s);
		//matches()方法会匹配所有的字符串,和\d{3,5}表达式去匹配,明显是不符合的
		p(m.matches());//false
		//如果不使用reset()方法,则匹配的字符串从34345-234-00开始,因为之前的123-被前面的matches()方法匹配了
		m.reset();
		//find()方法找子字符串,在这里必须先使用,不然后面的start()和end()方法不能正常使用
		p(m.find());
		p(m.start() + "-" + m.end());
		p(m.find());
		p(m.start() + "-" + m.end());
		p(m.find());
		p(m.start() + "-" + m.end());
		p(m.find());
		//如果没有使用上面的reset()方法,则使用下面的语句会抛异常
		//p(m.start() + "-" + m.end());
		
		//lookingAt()尝试将从区域开头开始的输入序列与该模式匹配。因此下面的四个输出总是true
		p(m.lookingAt());
		p(m.lookingAt());
		p(m.lookingAt());
		p(m.lookingAt());
		*/
 
		//replacement
		//Pattern.CASE_INSENSITIVE表示匹配不区分大小写,将偶数java全部设为大写
		/*
		Pattern p = Pattern.compile("java", Pattern.CASE_INSENSITIVE);
		Matcher m = p.matcher("java Java JAVa JaVa IloveJAVA you hateJava afasdfasdf");
		StringBuffer buf = new StringBuffer();
		int i=0;
		while(m.find()) {
			i++;
			if(i%2 == 0) {
				m.appendReplacement(buf, "java");
			} else {
				m.appendReplacement(buf, "JAVA");
			}
		}
		m.appendTail(buf);
		p(buf);
		*/
		
		//group
		//(\\d{3,5})([a-z]{2})表达式分了三组,第一组是整体匹配,为第0组,(\\d{3,5})为第1组,([a-z]{2})为第二组
		/*
		Pattern p = Pattern.compile("(\\d{3,5})([a-z]{2})");
		String s = "123aa-34345bb-234cc-00";
		Matcher m = p.matcher(s);
		//这里只有使用了find()方法,才能使用group()方法,不然会抛异常
		while(m.find()) {
			p(m.group());
		}
		System.out.println("找出只满足上面正则表达式其中一部分的情况——分组");
		System.out.println("匹配(\\d{3,5})");
		m.reset();
		while(m.find()) {
			//显示的是第一个括号的分组
			p(m.group(1));
		}
		System.out.println("匹配([a-z]{2})");
		m.reset();
		while(m.find()) {
			//显示的是第一个括号的分组
			p(m.group(2));
		}
		*/
		
		//qulifiers
		/*
		 * (.{3,10}?)表示的是Reluctant(不情愿的)匹配模式,会从最少的去匹配,即3个开始,如果不匹配会逐步增加匹配数量
		 * (.{3,10}+)表示的是Possessive(独占的)匹配模式,会直接匹配最大的数量,即10个,但是不会往少了去匹配,这种方式效率比较高
		 * 如果s = "aaaa5bbbb65"这样就能和+独占匹配方式匹配了
		 * (.{3,10})表示的是greedy(贪婪的)匹配模式,会直接匹配最大的数量,如果不匹配,会自动的往数量小的地方去匹配
		 */
		/*
		Pattern p = Pattern.compile("(.{3,10}+)[0-9]");
//		Pattern p = Pattern.compile("(.{3,10}?)[0-9]");
//		Pattern p = Pattern.compile("(.{3,10})[0-9]");
		String s = "aaaa5bbbb6";
		Matcher m = p.matcher(s);
		if(m.find()){
			p(m.group());
			p(m.start() + "-" + m.end());
		}
		else 
			p("not match!");
		*/
		
		//non-capturing groups
		/*
		//表示最后一个字符为a,且a不被捕获
		Pattern p = Pattern.compile(".{3}(?=a)");
		String s = "444a66b";
		Matcher m = p.matcher(s);
		while(m.find()) {
			p(m.group());
		}
		*/
	}	
	
	public static void p(Object o) {
		System.out.println(o);
	}

}
 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值