------Java培训、Android培训、iOS培训、.Net培训、期待与您交流! -------
正则表达式:符合一定规则的表达式。
作用:用于专门操作字符串。
特点:用于一些特定的符号来表示一些代码操作。这样就简化书写。
所以学习正则表达式,就是在学习一些特殊符号的使用。
好处:可以简化对字符串的复杂操作。
弊端:符号定义越多,正则越长,阅读性越差。
具体操作功能:
1,匹配:String matches方法。用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false。
2,切割:String split();
3,替换:String replaceAll(regex,str);如果regex中有定义组,可以在第二参数中通过$符号获取正则表达式中的已有的组
例子:
class RegexDemo {
public static void main(String[] args) {
/*
* 以(.)切割开字符串"zhangsan.lisi.wangwu",
*/
splitDemo("zhangsan.lisi.wangwu", "\\.");
/*
* 以(\\)分割开目录文件目录
*/
splitDemo("c:\\abc\\a.txt", "\\\\");
/*
* 按照叠词完成切割。为了可以让规则的结果被重用 可以将规则封装成一个组。用()完成。组的出现都有编号 从1开始。
* 想要使用已有的组可以通过,\n(n就是组的编号)的形式来获取。
*/
splitDemo("erkktyqqquizzzzzo", "(.)\\1+");
String str = "wer1389980000ty1234564uiod234345675f";// 将字符串中的数组(连续的数字)替换成#。
/**
* 将str字符串中的至少连续5位以上的数字替换成#
*/
replaceAllDemo(str, "\\d{5,}", "#");
String str1 = "erkktyqqquizzzzzo";// 将叠词替换成$. //将重叠的字符替换成单个字母。zzzz->z
/*
* 将str1连续出现两次以上的任意字符替换成一个该字符(也就是叠词替换)
*/
replaceAllDemo(str1, "(.)\\1+", "$1");
}
public static void replaceAllDemo(String str, String reg, String newStr) {
str = str.replaceAll(reg, newStr);
System.out.println(str);
}
public static void splitDemo(String str, String reg) {
String[] arr = str.split(reg);
System.out.println(arr.length);
for (String s : arr) {
System.out.println(s);
}
}
/*
* 匹配 手机号段只有 13xxx 15xxx 18xxxx
*/
public static void checkTel() {
String tel = "16900001111";
/*
* 第一位是1第二位是3,5,8第三到十一为是任意数字
*/
String telReg = "1[358]\\d{9}";
System.out.println(tel.matches(telReg));
}
/*
* 较验QQ号
*/
public static void checkQQ() {
String qq = "123a454";
/**
* 第一位是1-9数字,后面是任意数字,并且是长度为5-14
*/
String regex = "[1-9]\\d{4,14}";
boolean flag = qq.matches(regex);
if (flag)
System.out.println(qq + "...is ok");
else
System.out.println(qq + "... 不合法");
}
}
获取:将字符串中的符合规则的子串取出
操作步骤:
1,将正则表达式封装成对象。
2,让正则对象和要操作的字符串相关联。
3,关联后,获取正则匹配引擎。
4,通过引擎对符合规则的子串进行操作,比如取出
import java.util.regex.*;
class RegexDemo2 {
public static void main(String[] args) {
getDemo();
}
public static void getDemo() {
String str = "ming tian jiu yao fang jia le ,da jia。";
System.out.println(str);
/*
* 获取4个字母组成的单词
*/
String reg = "\\b[a-z]{3}\\b";
// 将规则封装成对象。
Pattern p = Pattern.compile(reg);
// 让正则对象和要作用的字符串相关联。获取匹配器对象。
Matcher m = p.matcher(str);
while (m.find()) {
System.out.println(m.group());
System.out.println(m.start() + "...." + m.end());
}
}
}
//练习:
import java.util.TreeSet;
class RegexTest {
public static void main(String[] args) {
test_1();
ipSort();
checkMail();
}
/*
* 需求:对邮件地址进行校验。
*/
public static void checkMail() {
String mail = "abc12@sina.com";
/*
* xxx@xx.xx [a-zA-Z0-9_]+ -->多个字母,数字,下划线
*
* @ -->邮件标志符 [a-zA-Z0-9]+ -->多个字母,数字 \\. -->符号. [a-zA-Z]+ -->多个字母,数字
* (\\.[a-zA-Z]+)+ -->多个如.xxx的字符串
*/
String reg = "[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+";// 较为精确的匹配。
/*
* \\w+ -->单词字符
*
* @ -->邮件标识符@ \\.\\w+ -->.加上多个单词符
*/
reg = "\\w+@\\w+(\\.\\w+)+";// 相对不太精确的匹配。
System.out.println(mail.matches(reg));
}
/*
* 需求: 将下列字符串转成:我要学编程.
*
* 到底用四种功能中的哪一个呢?或者哪几个呢? 思路方式: 1,如果只想知道该字符是否对是错,使用匹配。
* 2,想要将已有的字符串变成另一个字符串,替换。 3,想要按照自定的方式将字符串变成多个字符串。切割。获取规则以外的子串。
* 4,想要拿到符合需求的字符串子串,获取。获取符合规则的子串。
*/
public static void test_1() {
String str = "我我...我我...我要..要要...要要...学学学....学学...编编编...编程..程.程程...程...程";
/*
* 将已有字符串变成另一个字符串。使用 替换功能。 1,可以先将 . 去掉。 2,在将多个重复的内容变成单个内容。
*/
str = str.replaceAll("\\.+", "");
System.out.println(str);
str = str.replaceAll("(.)\\1+", "$1");
System.out.println(str);
}
/*
* 192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30
* 将ip地址进行地址段顺序的排序。
*
*
* 还按照字符串自然顺序,只要让它们每一段都是3位即可。 1,按照每一段需要的最多的0进行补齐,那么每一段就会至少保证有3位。
* 2,将每一段只保留3位。这样,所有的ip地址都是每一段3位。
*/
public static void ipSort() {
String ip = "192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30";
/**
* 连续的数字前面添加两个00
*/
ip = ip.replaceAll("(\\d+)", "00$1");
System.out.println(ip);
ip = ip.replaceAll("0*(\\d{3})", "$1");
System.out.println(ip);
String[] arr = ip.split(" +");
TreeSet<String> ts = new TreeSet<String>();
for (String s : arr) {
ts.add(s);
}
for (String s : ts) {
System.out.println(s.replaceAll("0*(\\d+)", "$1"));
}
}
}
网页爬虫:
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
class RegexTest2 {
public static void main(String[] args) throws Exception {
getMails_1();
}
public static void getMails_1() throws Exception {
URL url = new URL("http://bbs.csdn.net:80/home");
URLConnection conn = url.openConnection();
BufferedReader bufIn = new BufferedReader(new InputStreamReader(
conn.getInputStream()));
String line = null;
String mailreg = "\\w+@\\w+(\\.\\w+)+";
Pattern p = Pattern.compile(mailreg);
while ((line = bufIn.readLine()) != null) {
Matcher m = p.matcher(line);
while (m.find()) {
System.out.println(m.group());
}
}
}
}