黑马程序员_学习笔记第25天——正则表达式

---------------------- ASP.Net+Android+IOS开发、 href="http://edu.csdn.net"target="blank">.Net培训、期待与您交流! ----------------------

1、正则表达式:符合一定规则的表达式

作用:用于专门操作字符串

特点:用于一些特定的符号来表示一些代码操作,这样就简化书写。

好处:可以简化对字符串的复杂操作。

弊端:符号定义越多,正则越长,阅读性越差

2、具体操作功能:

匹配:String  matches方法,用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false

切割:String  split()

替换:String  replaceAll()

public class RegexDemo1 {

	public static void main(String[] args) {
		//checkQQ();
		//checkTel();
		//splitDemo("zhangsan.lisi.wangwu","\\.");
		//splitDemo("c:\\abc\\a.txt","\\\\");
		//splitDemo("askfkkkdakjsqqkf","(.)\\1+");//按照叠词完成切割,为了可以让规则结果被重用
												//可以将规则封装成一个组,用()完成。组的出现都有编号
												//从1开始,想要使用已有的组可以通过\n(n就是组的编号)的形式来获取。
		//String str = "wtwer14125243554sdf341241afjl341d";//将字符串中的数字替换成#
		//replaceAllDemo(str,"\\d{5,}","#");
		
		String str1 = "asdffkjkeeafaiiezzzzzle";//将叠词替换成& //将重叠字幕替换成单个字母
		replaceAllDemo(str1,"(.)\\1+","&");
		replaceAllDemo(str1,"(.)\\1+","$1");
		
	}
	//校验qq号
	public static void checkQQ(){
		String qq = "870987324";
		String regex = "[1-9][0-9]{4,14}";
		boolean flag = qq.matches(regex);
		if(flag)
			System.out.println(qq+"...is ok");
		else
			System.out.println(qq+"不合法...");
	}
	//校验手机号,手机号段只有13xx,15xx,18xx
	public static void checkTel(){
		String tel = "13451075098";
		String reg = "1[358]\\d{9}";
		boolean flag = tel.matches(reg);
		System.out.println(flag);
	}
	public static void splitDemo(String str,String reg){
//		String str = "zhangsan.lisi.wangwu";
//		String reg = " +";//按照多个空格来进行切割
//		String reg = "\\.";
		String[] arr = str.split(reg);
		System.out.println(arr.length);
		for(String s : arr){
			System.out.println(s);
		}
	}
	public static void replaceAllDemo(String str,String reg,String newStr){
		str = str.replaceAll(reg,newStr);
		System.out.println(str);
		
	}

}

3、获取:将字符串中的符合规则的子串取出

操作步骤:

1)将正则表达式封装成对象

2)让正则对象和要操作的字符串相关联

3)关联后,获取正则匹配引擎

4)通过引擎对符合规则的子串进行操作,比如取出

public class RegexDemo2 {

	public static void main(String[] args) {
		getDemo();

	}
	public static void getDemo(){
		String str = "ming tian jiu yao fang jia le";
		String reg ="\\b[a-z]{3}\\b";
		//将规则封装成对象
		Pattern p = Pattern.compile(reg);
		//让正则对象和要作用的字符串相关联,获取匹配器对象
		Matcher m = p.matcher(str);
//		boolean b = m.find();//将规则作用到字符串上,并进行复核规则的子串查找
//		System.out.println(b);
//		System.out.println(m.group());//用于获取匹配后结果
		while(m.find()){
			System.out.println(m.group());
		}
	}
}
4、练习

//需求:将下列字符串转成:我要学编程
/*
思路:
1、如果只想知道该字符串是对是错,使用匹配
2、想要将已有的字符串变成另一个字符串,替换
3、想要按照自定义 的方式将字符串变成多个字符串,切割,获取规则以外的子串
4、想要拿到符合需求的字符串子串,获取,获取符合规则的子串
 */
public class RegexTest1 {

	public static void main(String[] args) {
		String str1 = "我我...我我..我要...要要..要要..学学学...学学...编编编...编程...程程..程..程";
		String str2 = str1.replaceAll("(\\.)\\1+","");
		System.out.println(str2);
		String str3 = str2.replaceAll("(.)\\1+","$1");
		System.out.println(str3);
	}
}
5、ip地址段排序

/*
192.168.1.254  102.49.23.13  10.10.10.10  2.2.2.2  8.109.90.30
将ip地址进行地址段顺序的排序
还按照字符串自然顺序,只要让它们每一段都是3位即可
1、按照每一段需要的最多的0进行补齐,那么每一段就会至少保证有3位
2、将每一段只保留3三位,这样,所有的ip地址都是每一段3位
 */
public class RegexTest2 {

	public static void main(String[] args) {
		ipSort();

	}
	public static void ipSort(){
		String ip ="192.168.1.254  102.49.23.13  10.10.10.10  2.2.2.2  8.109.90.30";
		ip = ip.replaceAll("(\\d+)","00$1");
		System.out.println(ip);
		ip = ip.replaceAll("0*(\\d{3})","$1");
		System.out.println(ip);
		String[] arr = ip.split(" +");
		TreeSet<String> ts = new TreeSet<String>();
		for(String s : arr){
			ts.add(s);
		}
		for(String s : ts){
			System.out.println(s.replaceAll("0*(\\d+)","$1"));
		}
		/*Arrays.sort(arr);
		for(String s : arr){
			System.out.println(s);
		}*/
	}

}
6、校验邮箱地址

//需求:对邮件地址进行校验
public class RegexTest3 {

	public static void main(String[] args) {
		checkMail();
	}
	public static void checkMail(){
		String mail = "abc12@sina.com.cn";
		String reg = "[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+){1,3}";//较为精确的匹配
//		reg = "\\w+@\\w+(\\.\\w)+";//相对不太精确的匹配
		System.out.println(mail.matches(reg));
	}
}
7、网页爬虫

//网页爬虫(蜘蛛)
public class RegexTest4 {

	public static void main(String[] args) throws Exception{
		//getMails1();
		getMails2();
	}
	//获取指定文档中的邮件地址,使用获取功能,Pattern Matcher
	public static void getMails1() throws Exception {
		BufferedReader bufr = new BufferedReader(new FileReader("d:\\mail.txt"));
		String line = null;
		String mailreg = "\\w+@\\w+(\\.\\w+)+";
		Pattern p = Pattern.compile(mailreg);
		while((line=bufr.readLine())!=null) {
			Matcher m = p.matcher(line);
			while(m.find()){
				System.out.println(m.group());
			}
		}
	}
	public static void getMails2() throws Exception {
		URL url = new URL("http://192.168.1.102:8080/myweb/mail.html");
		URLConnection conn = url.openConnection();
		BufferedReader bufIn = new BufferedReader(new InputStreamReader(conn.getInputStream()));
		String line = null;
		String mailreg = "\\w+@\\w+(\\.\\w+)+";
		Pattern p = Pattern.compile(mailreg);
		while((line=bufIn.readLine())!=null) {
			Matcher m = p.matcher(line);
			while(m.find()){
				System.out.println(m.group());
			}
		}
	}

}





---------------------- ASP.Net+Android+IOS开发、 href="http://edu.csdn.net"target="blank">.Net培训、期待与您交流! ----------------------详细请查看: http://edu.csdn.net
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值