Java--正则表达式

正则表达式:符合一定规则的表达式。

 作用:用于专门操作字符串。
 特点:用于一些特定的符号来表示一些代码操作。这样就简化书写。
 所以学习正则表达式,就是在学习一些特殊符号的使用。

 好处:可以简化对字符串的复杂操作。
 弊端:符号定义越多,正则越长,阅读性越差。


具体操作功能:

1,匹配:用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false。 
2,切割:将字符串按某种规则进行切割
3,替换:将字符串中的字符按某种规则进行替换
4,获取:将字符串中的符合规则的子串取出。

package fu.dao.li.carzy.java;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/*
 * java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现:
 * 	正则的使用方法:
 * 		1.构造一个模式:Pattern p=Pattern.compile("[a-z]*")
 * 		2.建造一个匹配器:Matcher m=p.matcher(str)
 * 		3.进行判断,得到结果:boolean b=m.matches()
 * */

public class RegexTest {

	public static void main(String[] args) {
		Pattern p=Pattern.compile("[a*z]");
		Matcher m=p.matcher("ghj");
		boolean b=m.matches();
		System.out.println(b);
		
		
		//匹配电话号码:第一位为1,第二位为5或8,一共是11位数
		 * ^:匹配一行的开头
		 * []:表示字符只能是中括号中的任意一个
		 * {n}:表示前面字符出现的次数
		 * 
		Pattern pattern=Pattern.compile("^[1][5,8]\\d{9}");
		String[] phone={"18695251153","15395251153","13395251153","1a395251153"};
		for(int i=0;i<4;i++){
			boolean flag=pattern.matcher(phone[i]).matches();
			if(flag)
				System.out.println(phone[i]);
		}
		
		
		//匹配身份证
		 * $:匹配一行的结尾
		 * |:指定两项之间任选一项
		 * 
		String pattern="(\\d{17}[x,X]$)|(\\d{18})";
		String[] ids={"340881198911110814","34088119891111081x","34088119891111081X"};
		for(int i=0;i<3;i++){
			boolean flag=Pattern.matches(pattern,ids[i]);
			if(flag)
				System.out.println(ids[i]);
			
		}
		
		//匹配QQ邮箱地址
		 * *:指定前面子表达式可以出现零次或多次
		 * \d:匹配0-9的所有数字
		 * \D:匹配非数字
		String pattern="\\d*@[Q,q]{2}\\.com";
		String[] emails={"135136@qq.com","135651@Q.com","1391381305@QQ.com"};
		for(int i=0;i<emails.length;i++){
			boolean flag=Pattern.matches(pattern, emails[i]);
			if(flag)
				System.out.println(emails[i]);
		}

		//匹配IP地址
		 //X{n,m}:表示表示X出现的次数不少于n不大于m次
		String pattern="(\\d{1,3}\\.){3}\\d{1,3}";
		String[] ips={"195.168.155.230","195.236.23.02.2","56.23.15","15.89.2.as"};
		for(int i=0;i<ips.length;i++){
			boolean flag=Pattern.matches(pattern, ips[i]);
			if(flag)
				System.out.println(ips[i]);
		}
		
		
		
		//匹配中文
		//+:指前面的子表达式可以出现一次或多次
		//\u4e00-u9fa5:指中文的范围
		//[]:指中只能出现[]中的字符范围
		String pattern="^[\u4e00-\u9fa5]+$";
		String[] str={"中","你好哈","hello你好","哈哈haha","我不好呢"};
		for(int i=0;i<str.length;i++){
			boolean flag=Pattern.matches(pattern, str[i]);
			if(flag)
				System.out.println(str[i]);
		}
	}
	public static void split(){
		//按数字对字符串进行切割
		Pattern p=Pattern.compile("\\d+");
		String str="lidaofu12daofuli520hahadaf";
		String[] strs=p.split(str);
		for(int i=0;i<strs.length;i++)
			System.out.println(strs[i]);
	}
	
	public static void replace(){
		//将所有数字2替换成lidaofu
		Pattern p=Pattern.compile("[2]");
		String str="hahat520daifjda520";
		Matcher m=p.matcher(str);
		String str1=m.replaceAll("lidaofu");
		System.out.println(str1);
	}
}


常用的匹配模式:

匹配特定数字:
 ^[1-9]d*$    //匹配正整数
 ^-[1-9]d*$   //匹配负整数
 ^-?[1-9]d*$   //匹配整数
 ^[1-9]d*|0$  //匹配非负整数(正整数 + 0)
 ^-[1-9]d*|0$   //匹配非正整数(负整数 + 0)
 ^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数
 ^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数
 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数
 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数 + 0)
 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0)
 评注:处理大量数据时有用,具体应用时注意修正
 
匹配特定字符串:
 ^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
 ^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
 ^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
 ^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
 ^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
 

只能输入数字:“^[0-9]*$”
 只能输入n位的数字:“^d{n}$”
 只能输入至少n位数字:“^d{n,}$”
 只能输入m-n位的数字:“^d{m,n}$”
 只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$”
 只能输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$”
 只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})?$”
 只能输入非零的正整数:“^+?[1-9][0-9]*$”
 只能输入非零的负整数:“^-[1-9][0-9]*$”
 只能输入长度为3的字符:“^.{3}$”
 只能输入由26个英文字母组成的字符串:“^[A-Za-z]+$”
 只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$”
 只能输入由26个小写英文字母组成的字符串:“^[a-z]+$”
 只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$”
 只能输入由数字、26个英文字母或者下划线组成的字符串:“^w+$”
 验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为:以字母开头,长度在6-18之间,
 
只能包含字符、数字和下划线。
 验证是否含有^%&’,;=?$”等字符:“[^%&’,;=?$x22]+”
 只能输入汉字:“^[u4e00-u9fa5],{0,}$”
 验证Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
 验证InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
 验证电话号码:“^((d{3,4})|d{3,4}-)?d{7,8}$”
 
正确格式为:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
 
“XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。
 验证身份证号(15位或18位数字):“^d{15}|d{}18$”
 验证一年的12个月:“^(0?[1-9]|1[0-2])$”正确格式为:“01”-“09”和“1”“12”
 验证一个月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
 
正确格式为:“01”“09”和“1”“31”。
 
匹配中文字符的正则表达式: [u4e00-u9fa5]
 匹配双字节字符(包括汉字在内):[^x00-xff]
 匹配空行的正则表达式:n[s| ]*r
 匹配HTML标记的正则表达式:/< (.*)>.*|< (.*) />/
 匹配首尾空格的正则表达式:(^s*)|(s*$)
 匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
 匹配网址URL的正则表达式:
http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

 

public class RegeteTest{
	public static void main(String[] args) throws Exception{
		splitRepeat();
		getMails();
	}
	public static void splitRepeat(){
		//按叠词进行切割
		String pattern="(.)\\1+";
		String str="我aaaaa要dddddd学fff编程";
		String newstr[]=str.split(pattern);
		for(int i=0;i<newstr.length;i++)
			System.out.print(newstr[i]);
		
	}
	
	public static void replaceRepeat(){
		//将字符中的叠词变成一个词
		//():代表组的概念,组的出现有编号从1开始+表示组可以出现多次
		//$:表示当前组中的内容,1表示组的编号
		String pettern="(.)\\1+";
		String str="iiiiloveeeeeyouuuu";
		String newstr=str.replaceAll(pettern,"$1");
		System.out.println(newstr);
		
	}
	
	public static void checkEmail(){
		//匹配任意的邮箱
		String pettern="[a-zA-Z0-9_]+@[a-zA-z0-9]+([\\.[a-zA-Z]+])+";
		String[] emails={"lidaf@email.com","1391351305@qq.com","lidaofu@163.com"};
		for(int i=0;i<emails.length;i++){
			boolean flag=Pattern.matches(pettern, emails[i]);
			if(flag)
				System.out.println(emails[i]);
		}
	}
	
	public static void split(){
		//按数字对字符串进行切割
		Pattern p=Pattern.compile("\\d+");
		String str="lidaofu12daofuli520hahadaf";
		String[] strs=p.split(str);
		for(int i=0;i<strs.length;i++)
			System.out.println(strs[i]);
	}
	
	public static void replace(){
		//将所有数字2替换成lidaofu
		Pattern p=Pattern.compile("[2]");
		String str="hahat520daifjda520";
		Matcher m=p.matcher(str);
		String str1=m.replaceAll("lidaofu");
		System.out.println(str1);
	}
	
	public static void replaceTest(){
		//将"我我...我我...我要..要要...要要...学学学....学学...编编编...编程..程.程程...程...程"变成"我要学编程"
		String str="我我...我我...我要..要要...要要...学学学....学学...编编编...编程..程.程程...程...程";
		//将...替换成""字符串变成“我我我要要要要学学学编编程程”
		str=str.replaceAll("\\.","");
		//将字符中的叠词替换成一个
		str=str.replaceAll("(.)\\1+","$1");
		System.out.println(str);	
	}
	
	public static void getMails() throws Exception {
		//网页爬虫程序,获取网页上的邮箱
		URL url = new URL("http://192.168.1.254:8080/myweb/mail.html");
		//获取连接
		URLConnection conn = url.openConnection();
		BufferedReader bufIn = new BufferedReader(new InputStreamReader(
				conn.getInputStream()));
		String line = null;
		String mailreg = "\\w+@\\w+(\\.\\w+)+";
		//创建模式
		Pattern p = Pattern.compile(mailreg);
		while ((line = bufIn.readLine()) != null) {
			//模式匹配
			Matcher m = p.matcher(line);
			while (m.find()) {
				System.out.println(m.group());
			}
		}
	}
	
	public static void getWord(){
		//获取一个单词
		//\b:表示单词的边界
		//+:表示出现一次或多次
		Pattern p=Pattern.compile("\\b[a-z]+\\b");
		String str="hello my name is lidaofu";
		Matcher m=p.matcher(str);
		while(m.find())
			System.out.println(m.group());
	}
	
	
	
}


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值