正则表达式 (Regular Expressions)

最新推荐文章于 2019-06-04 15:52:27 发布

肚小糖

最新推荐文章于 2019-06-04 15:52:27 发布

阅读量510

点赞数

分类专栏： Java基础学习笔记文章标签：正则表达式 java Pattern Matcher

本文链接：https://blog.csdn.net/yuefanyishi/article/details/48165867

版权

Java基础学习笔记专栏收录该内容

16 篇文章 0 订阅

订阅专栏

一.概述

正则表达式是用来匹配字符串的一种模式。
　　写法：字符{数量}位置
　　应用：匹配验证、分割、查找、替换。
　　常见符号：

二.应用

1.匹配

String类中的boolean matches(String regex)方法。用规则匹配整个字符串，只要有一处不符合规则，就匹配结束，返回false。


public class MatchesDemo {
	/*
	 验证QQ号码
	 要求： 5-15位数，0不能开头，只能是数字
	 */
	//方式一：不用正则表达式
	public static void qqCheck_1(String qq){
		if(!qq.startsWith("0"))
		{
			if(qq.length() >= 5 && qq.length() <= 15){
				try{
					Long l = Long.parseLong(qq);
					System.out.println("QQ号码正确");
				}catch(NumberFormatException e){
					System.out.println("包含非法字符！");
				}
			}
			else
				System.out.println("长度非法！");
		}
		else
			System.out.println("没有0开头的号码！");
	}
	//方式二：用正则实现
	public static void qqCheck_2(String qq){
		String regex = "[1-9]\\d{4,14}";
		if (qq.matches(regex))
			System.out.println("QQ号正确");
		else
			System.out.println(qq+"： 非法号码！");
	}
	/*
	 验证手机号码
	 要求： 13,15或18开头，11位数
	 */
	public static void phoneCheck(String phone){
		String regex = "1[358]\\d{9}";
		if(phone.matches(regex))
			System.out.println("手机号码正确");
		else
			System.out.println("号码不对！");
	}
	public static void main(String[] args){
		String qq = "1234234";
		qqCheck_1(qq);
		qqCheck_2(qq);
		
		String phone = "13812345678";
		phoneCheck(phone);
	}
}

2.分割

String类中String[]split(String regex)方法。

public class SplitDemo {
	public static void main(String[] args){
		//按.分割
		String regex1 = "\\.";
		String[] arr = "192.168.1.62".split(regex1);
		print(arr);
		//按空格分割，+表示可能有一个或多个空格
		String regex2 = " +";
		arr = "God helps    those  who    help themselves".split(regex2);
		print(arr);
		//按叠词(出现两次或两次以上的字母)分割
		String regex3 = "(.)\\1+";
		arr = "ItthhiinnkkkkiiloveUUUu".split(regex3);
		print(arr);
	}
	public static void print(String[] arr){
		for (String s: arr)
			System.out.println(s);
	}
}

3.替换

String replaceAll(String regex,String replacement)方法。
　　对于组中所匹配的字符，可以用 $n 来获取。$ 在正则中表示行的结尾，所以出现在正则中不能用来表示组，一般用于替换中。

public class ReplaceDemo {
	public static void main(String[] args){
		//将字符串中连续出现3次或3次以上的数字群替换成#
		String regex1 = "\\d{3,}";
		String s1 = "God323is594a490girl";
		s1 = s1.replaceAll(regex1, "#");
		System.out.println(s1);
		//将叠词替换为一个，$1表示符合组中一个字符
		String regex2 = "(.)\\1+";
		String s2 = "Itiisssabeeauttiffffffuuullnniighhhttt";
		s2 =s2.replaceAll(regex2, "$1");
		System.out.println(s2);
	}
}

4.获取

步骤：
　　1）将正则表达式封装成对象。
　　2）让正则对象和要操作的字符串相关联。
　　3）关联后，获取正则匹配引擎。
　　4）通过引擎对符合规则的子串进行操作，比如取出。

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternDemo {
	public static void main(String[] args){
		String s = "Tomorrow is a good day, and we plan to have a trip"; 
		//获取字符串中4个字母的单词
		String regex = "\\b[a-z]{4}\\b";
		get(s, regex);
	}
	public static void get(String s, String regex){
		//将规则封装成对象
		Pattern p = Pattern.compile(regex);
		//让正则对象和要作用的字符串相关联，获取匹配器对象
		Matcher m = p.matcher(s);
		//find()方法是将规则作用到字符串上，并进行符合规则的子串查找。
		while(m.find()){
			//group()方法用于获取匹配后结果。
			System.out.println(m.group());
			//start()和end()分别表示匹配字符的开始和结尾的索引
			System.out.println(m.start()+"..."+m.end());
		}
	}
}

三、实例

应用技巧：
　　1）如果只想知道该字符是否对是错，使用匹配。
　　2）想要将已有的字符串变成另一个字符串，替换。
　　3）想要按照自定的方式将字符串变成多个字符串。切割。获取规则以外的子串。
　　4）想要拿到符合需求的字符串子串，获取。获取符合规则的子串。

/*
 去掉字符串中的"."，把重复的字符变成单个字符
 */
public class ReplaceTest {
	public static void main(String[] args){
		String s = "我我...有...蛇蛇蛇....蛇蛇....精精精....病....病病.....";
		String regex = "\\.+";
		s = s.replaceAll(regex, "");
		regex = "(.)\\1+";
		s = s.replaceAll(regex, "$1");
		System.out.println(s);
	}
}

/*
 将IP地址进行地址段顺序的排序
 思路：
 1.每一段都先补全3位
 2.利用集合进行排序
 3.删除每段前面补的0
 */
import java.util.TreeSet;
public class IPSortTest {
	public static void main(String[] args){
		String ip = "192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.301";
		String regex = "(\\d+)";
		ip = ip.replaceAll(regex,"00$1"); //保证每段至少都有3位
		System.out.println(ip);
		regex = "0*(\\d{3})";
		ip = ip.replaceAll(regex,"$1"); //每段只保留3位
		System.out.println(ip);
		regex = " ";
		String[] arr = ip.split(regex); //按空格分割
		//定义一个TreeSet集合，利用元素自然排序
		TreeSet<String> ts = new TreeSet<String>();
		for(String str: arr){
			ts.add(str);
		}
		regex = "0*(\\d)";
		for(String s: ts){
			System.out.println(s.replaceAll(regex, "$1"));
		}
	}
}

/*
 对邮件进行校验
 要求： xxxxx@xx(.xx)，括号内的内容出现1-3次
 */
public class CheckMail {
	public static void main(String[] args){
		String mail = "123sfsl7@sina.com.cn";
		String regex = "\\w+@[a-zA-Z0-9]+(\\.[a-zA-Z]+){1,3}";
		System.out.println(mail.matches(regex));
	}
}

/*
网络爬虫（蜘蛛）
*/
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Spider {
	public static void main(String[] args) throws Exception{
		getWebMail();
	}
	public static void getWebMail() throws Exception{
		//封装网页地址
		URL url = new URL("http://tieba.baidu.com/p/1390896758");
		//链接服务器
		URLConnection conn = url.openConnection();
		//带缓冲区的网页读取流
		BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream()));
		String line = null;
		//定义匹配邮件地址的正则表达式
		String regex = "\\w+@\\w+(\\.\\w+)+";
		Pattern p = Pattern.compile(regex); //封装正则表达式
		//读取网页数据
		while((line = br.readLine()) != null){
			//正则关联数据
			Matcher m = p.matcher(line);
			//寻找匹配邮箱
			while (m.find()){
				System.out.println(m.group()); //输出匹配邮箱
			}
		}
	}
	//获取指定文档中的邮件地址。使用获取功能。Pattern Matcher
	public static void getFileMail() throws Exception{
		//将文件封装成对象
		File file = new File("E:\\mail.txt");
		//创建带缓冲区的读取流
		BufferedReader br = new BufferedReader(new FileReader(file));
		String line = null;
		//定义正则表达式
		String regex = "\\w+@[a-zA-Z]+(\\.(a-zA-Z]+)+";
		//创建Pattern对象，封装正则表达式
		Pattern p = Pattern.compile(regex);
	    //读取文件中数据
		while((line = br.readLine()) != null){
			//关流字符串
			Matcher m = p.matcher(line);
			while(m.find()){ //寻找匹配的字符串
				System.out.println(m.group()); //输出匹配的字符串
			}
		}
	}
}

肚小糖

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式 (Regular Expressions)

——Java培训、Android培训、iOS培训、.Net培训、期待与您交流！ ——-一、正则表达式（Regular Expressions)一.概述　　正则表达式是用来匹配字符串的一种模式。　　写法：字符{数量}位置　　应用：匹配验证、分割、查找、替换。　　常见符号：二.应用1.匹配　　String类中的boolean matches(String r
复制链接

扫一扫