正则表达式(Regex):是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。
作用:在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。 许多程序设计语言都支持利用正则表达式进行字符串操作。
示例1:对QQ号码进行校验。要求:5-15位,不能以0开头,只能是数字。
class RegexDemo
{
public static void main(String[] arge)
{
checkQQ();
checkQQ_1();
}
public static void checkQQ()//用正则表达式进行校验
{
String qq = "124566d";
String regex = "[1-9][0-9]{4,14}";
boolean flag = qq.matches(regex);
if(flag)
{
System.out.println(qq+"~~~~~It is OK");
}
else
System.out.println(qq+"~~~~~不合法");
}
public static void checkQQ_1()//用String的方法组合进行校验
{
String qq = "12345a";
boolean flag = true;
int len = qq.length();
if(len>=5 && len<=15)
{
if(!qq.startsWith("0"))
{
try
{
long l = Long.parseLong(qq);
}
catch(NumberFormatException e)
{
System.out.println("出现非法字符");
}
/* char[] arr = qq.toCharArray();
for(int x=0;x<arr.length;x++)
{
if(!(arr[x]>='0' && arr[x]<='9'))
{
flag = false;
break;
}
}
if(flag)
{
System.out.println("qq:"+qq);
}
else
{
System.out.println("出现非法字符");
}*/
}
else
{
System.out.println("以0开头错误");
}
}
else
{
System.out.println("非法");
}
}
}
正在表达式的切割
class RegexDemo
{
public static void main(String[] arge)
{
//splitDemo("zhangsan.lisi.wangwu","\\.");
//splitDemo("c:\\abc\\a.txt","\\\\");
//叠词切割
//可以将规则封装成一个组,用()完成,组的出现都有编号。
//从1开始。想要使用已有的组可以通过 \n(n就是组的编号)的形式来获取
splitDemo("sdkkkkfasdqqqqqfas","(.)\\1+");。
}
public static void splitDemo(String str,String reg)
{
String[] arrs = str.split(reg);
System.out.println(arrs.length);
for(String arr: arrs)
{
System.out.println(arr);
}
}
}
替换
class RegexDemo
{
public static void main(String[] arge)
{
/
String str = "sdfsdffgr7989768968sdfer987079879erer89708789789j";
replaceAllDemo(str,"\\d{5,}","*");//将连续数字符号超过5个的替换为*
String str1 = "rtrtrqqqquizzzzdgd";
replaceAllDemo(str1,"(.)\\1+","$1");//将叠词替换为一个 qqqq---->q
}
public static void replaceAllDemo(String str , String reg,String newStr)
{
System.out.println(str);
str = str.replaceAll(reg ,newStr);
System.out.println(str);
}
}
获取:将字符串中的符合规则的子串取出。
操作步骤:1、将正则表达式封装成对象。2、让正则对象和要操作的字符串相关联。3、关联后,获取正则匹配引擎。4、通过引擎对符合规则的子串进行操作,比如取出。
import java.util.regex.*;
class RegexDemo2
{
public static void main(String[] args)
{
getDemo();
}
public static void getDemo()
{
String str = "ming tian jiu yao fang jia le da jia .";
System.out.println(str);
String reg = "\\b[a-z]{3}\\b";
//将规则封装成对象。
Pattern p = Pattern.compile(reg);
//让正则对象和要作用的字符串相关联。
Matcher m = p.matcher(str);
//System.out.println(m.matches());
while(m.find())
{
System.out.println(m.group());
System.out.println(m.start()+"^^^^^^^"+m.end());
}
}
}
总结处理思路:
1、 如果只想知道该字符是否是对的,使用匹配。
2、 想要将已有的字符串变成另一个字符串,替换。
3、 想要按照自定义的方式将字符串成多个字符串。切割,获取规则以外的子串。
4、 想要拿到符合需求的字符串,获取。获取符合规则的子串。
示例:
class RegexTest
{
public static void main(String[] args)
{
test_1();
}
public static void test_1()
{
String str = "我我......我我.....我要.....要.....要....学学.....编程";
str = str.replaceAll("\\.","");
System.out.println(str);
str = str.replaceAll("(.)\\1+","$1");
System.out.println(str);
}
}
综合示例:
import java.util.*;
class RegexTest
{
public static void main(String[] args)
{
// test_1();
// ipSort();
checkMail();
}
/*
需求:对邮件地址进行校验。
*/
public static void checkMail()
{
String mail = "abc12@sina.com";
mail = "1@1.1";
String reg = "[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+";//较为精确的匹配。
reg = "\\w+@\\w+(\\.\\w+)+";//相对不太精确的匹配。
//mail.indexOf("@")!=-1
System.out.println(mail.matches(reg));
}
/*
需求:
将下列字符串转成:我要学编程.
到底用四种功能中的哪一个呢?或者哪几个呢?
思路方式:
1,如果只想知道该字符是否对是错,使用匹配。
2,想要将已有的字符串变成另一个字符串,替换。
3,想要按照自定的方式将字符串变成多个字符串。切割。获取规则以外的子串。
4,想要拿到符合需求的字符串子串,获取。获取符合规则的子串。
*/
public static void test_1()
{
String str = "我我...我我...我要..要要...要要...学学学....学学...编编编...编程..程.程程...程...程";
/*
将已有字符串变成另一个字符串。使用 替换功能。
1,可以先将 . 去掉。
2,在将多个重复的内容变成单个内容。
*/
str = str.replaceAll("\\.+","");
System.out.println(str);
str = str.replaceAll("(.)\\1+","$1");
System.out.println(str);
}
/*
192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30
将ip地址进行地址段顺序的排序。
还按照字符串自然顺序,只要让它们每一段都是3位即可。
1,按照每一段需要的最多的0进行补齐,那么每一段就会至少保证有3位。
2,将每一段只保留3位。这样,所有的ip地址都是每一段3位。
*/
public static void ipSort()
{
String ip = "192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30";
ip = ip.replaceAll("(\\d+)","00$1");
System.out.println(ip);
ip = ip.replaceAll("0*(\\d{3})","$1");
System.out.println(ip);
String[] arr = ip.split(" ");
TreeSet<String> ts = new TreeSet<String>();
for(String s : arr)
{
ts.add(s);
}
for(String s : ts)
{
System.out.println(s.replaceAll("0*(\\d+)","$1"));
}
}
}