黑马程序员-----java基础 正则表达式

                            ------Java培训、Android培训、iOS培训、.Net培训、期待与您交流! -------

正则表达式:符合一定规则的表达式。
    作用:用于专门操作字符串。
    特点:用于一些特定的符号来表示一些代码操作。这样就简化书写。
    所以学习正则表达式,就是在学习一些特殊符号的使用。

    好处:可以简化对字符串的复杂操作。
    弊端:符号定义越多,正则越长,阅读性越差。


具体操作功能:

1,匹配:String  matches方法。用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false。
    
2,切割:String split();

3,替换:String replaceAll(regex,str);如果regex中有定义组,可以在第二参数中通过$符号获取正则表达式中的已有的组

例子:

class RegexDemo {
	public static void main(String[] args) {

		/*
		 * 以(.)切割开字符串"zhangsan.lisi.wangwu",
		 */
		splitDemo("zhangsan.lisi.wangwu", "\\.");

		/*
		 * 以(\\)分割开目录文件目录
		 */
		splitDemo("c:\\abc\\a.txt", "\\\\");

		/*
		 * 按照叠词完成切割。为了可以让规则的结果被重用 可以将规则封装成一个组。用()完成。组的出现都有编号 从1开始。
		 * 想要使用已有的组可以通过,\n(n就是组的编号)的形式来获取。
		 */
		splitDemo("erkktyqqquizzzzzo", "(.)\\1+");

		String str = "wer1389980000ty1234564uiod234345675f";// 将字符串中的数组(连续的数字)替换成#。
		/**
		 * 将str字符串中的至少连续5位以上的数字替换成#
		 */
		replaceAllDemo(str, "\\d{5,}", "#");

		String str1 = "erkktyqqquizzzzzo";// 将叠词替换成$. //将重叠的字符替换成单个字母。zzzz->z
		/*
		 * 将str1连续出现两次以上的任意字符替换成一个该字符(也就是叠词替换)
		 */
		replaceAllDemo(str1, "(.)\\1+", "$1");

	}

	public static void replaceAllDemo(String str, String reg, String newStr) {
		str = str.replaceAll(reg, newStr);

		System.out.println(str);
	}

	public static void splitDemo(String str, String reg) {

		String[] arr = str.split(reg);
		System.out.println(arr.length);
		for (String s : arr) {
			System.out.println(s);
		}
	}

	/*
	 * 匹配 手机号段只有 13xxx 15xxx 18xxxx
	 */
	public static void checkTel() {
		String tel = "16900001111";
		/*
		 * 第一位是1第二位是3,5,8第三到十一为是任意数字
		 */
		String telReg = "1[358]\\d{9}";
		System.out.println(tel.matches(telReg));
	}

	/*
	 * 较验QQ号
	 */
	public static void checkQQ() {
		String qq = "123a454";

		/**
		 * 第一位是1-9数字,后面是任意数字,并且是长度为5-14
		 */
		String regex = "[1-9]\\d{4,14}";

		boolean flag = qq.matches(regex);
		if (flag)
			System.out.println(qq + "...is ok");
		else
			System.out.println(qq + "... 不合法");

	}

}

获取:将字符串中的符合规则的子串取出
操作步骤:
1,将正则表达式封装成对象。
2,让正则对象和要操作的字符串相关联。
3,关联后,获取正则匹配引擎。
4,通过引擎对符合规则的子串进行操作,比如取出

import java.util.regex.*;

class RegexDemo2 {
	public static void main(String[] args) {
		getDemo();
	}

	public static void getDemo() {
		String str = "ming tian jiu yao fang jia le ,da jia。";
		System.out.println(str);
		/*
		 * 获取4个字母组成的单词
		 */
		String reg = "\\b[a-z]{3}\\b";

		// 将规则封装成对象。
		Pattern p = Pattern.compile(reg);

		// 让正则对象和要作用的字符串相关联。获取匹配器对象。
		Matcher m = p.matcher(str);

		
		while (m.find()) {
			System.out.println(m.group());
			System.out.println(m.start() + "...." + m.end());
		}
	}
}

//练习:

import java.util.TreeSet;

class RegexTest {
	public static void main(String[] args) {
		test_1();
		ipSort();

		checkMail();
	}

	/*
	 * 需求:对邮件地址进行校验。
	 */
	public static void checkMail() {
		String mail = "abc12@sina.com";

		/*
		 * xxx@xx.xx [a-zA-Z0-9_]+ -->多个字母,数字,下划线
		 * 
		 * @ -->邮件标志符 [a-zA-Z0-9]+ -->多个字母,数字 \\. -->符号. [a-zA-Z]+ -->多个字母,数字
		 * (\\.[a-zA-Z]+)+ -->多个如.xxx的字符串
		 */
		String reg = "[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+";// 较为精确的匹配。

		/*
		 * \\w+ -->单词字符
		 * 
		 * @ -->邮件标识符@ \\.\\w+ -->.加上多个单词符
		 */
		reg = "\\w+@\\w+(\\.\\w+)+";// 相对不太精确的匹配。

		System.out.println(mail.matches(reg));
	}

	/*
	 * 需求: 将下列字符串转成:我要学编程.
	 * 
	 * 到底用四种功能中的哪一个呢?或者哪几个呢? 思路方式: 1,如果只想知道该字符是否对是错,使用匹配。
	 * 2,想要将已有的字符串变成另一个字符串,替换。 3,想要按照自定的方式将字符串变成多个字符串。切割。获取规则以外的子串。
	 * 4,想要拿到符合需求的字符串子串,获取。获取符合规则的子串。
	 */
	public static void test_1() {
		String str = "我我...我我...我要..要要...要要...学学学....学学...编编编...编程..程.程程...程...程";
		/*
		 * 将已有字符串变成另一个字符串。使用 替换功能。 1,可以先将 . 去掉。 2,在将多个重复的内容变成单个内容。
		 */
		str = str.replaceAll("\\.+", "");
		System.out.println(str);

		str = str.replaceAll("(.)\\1+", "$1");

		System.out.println(str);

	}

	/*
	 * 192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30
	 * 将ip地址进行地址段顺序的排序。
	 * 
	 * 
	 * 还按照字符串自然顺序,只要让它们每一段都是3位即可。 1,按照每一段需要的最多的0进行补齐,那么每一段就会至少保证有3位。
	 * 2,将每一段只保留3位。这样,所有的ip地址都是每一段3位。
	 */
	public static void ipSort() {
		String ip = "192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30";

		/**
		 * 连续的数字前面添加两个00
		 */
		ip = ip.replaceAll("(\\d+)", "00$1");
		System.out.println(ip);

		ip = ip.replaceAll("0*(\\d{3})", "$1");
		System.out.println(ip);

		String[] arr = ip.split(" +");

		TreeSet<String> ts = new TreeSet<String>();

		for (String s : arr) {
			ts.add(s);
		}

		for (String s : ts) {
			System.out.println(s.replaceAll("0*(\\d+)", "$1"));
		}
	}

}

网页爬虫:

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

class RegexTest2 {
	public static void main(String[] args) throws Exception {
		getMails_1();
	}

	public static void getMails_1() throws Exception {
		URL url = new URL("http://bbs.csdn.net:80/home");

		URLConnection conn = url.openConnection();

		BufferedReader bufIn = new BufferedReader(new InputStreamReader(
				conn.getInputStream()));

		String line = null;

		String mailreg = "\\w+@\\w+(\\.\\w+)+";
		Pattern p = Pattern.compile(mailreg);

		while ((line = bufIn.readLine()) != null) {
			Matcher m = p.matcher(line);
			while (m.find()) {
				System.out.println(m.group());
			}
		}
	}
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值