黑马程序员_Java基础_正则表达式,校验QQ号,手机号,邮箱,IP地址排序,网络爬虫

一,正则表达式

概述:符合一定规则的表达式。用于专门用于操作字符串的。虽然字符串中有很多字符串的操作方法,但是使用起来比较繁琐,而且代码量比较多。

特点:用一些特定的符号表示以一些代码操作,简化书写,学习正则表达式就是学习一些特殊符号的使用。

好处:可以简化对字符串的复杂操作。

 

拿一个简单的例子比较说明:比如需要编写一个程序验证QQ号是否正确,首先QQ号必须是515位的,第一位19开头,后面可以使任意的数字。

使用传统操作字符串的方法:判断字符串长度是不是515,不满足则提示错误,满足在判断第一位是不是19,不满足提示错误,满足在循环遍历第二位以后字符是不是09的数字,不是则推出提示错误,满足则打印该QQ号。


class QQCheckDemo
{
    public static void main(String[] args) {
        String QQ = "75332414";
        if(QQ.length()>=5 && QQ.length()<=15)
        {
            if (!(QQ.startsWith("0")))
            {
                char[] arr = QQ.toCharArray();
                boolean flag = true;
                for (int i=0;i<QQ.length() ;i++ )
                {
                    //System.out.println(arr[i]);
                    if(!(arr[i]>='0' && arr[i]<='9'))
                    {
                        flag = false;
                        System.out.println("出现非法字符");
                        break;
                    }
                }
                if (flag)
                {
                    System.out.println(QQ);
                }
            
            }
            else
                System.out.println("首位不能为0");
        }
        else
            System.out.println("QQ位数出错");
    }
}

分析发现以上代码还可以简化,当字符串长度满足后,可以通过将字符串转换成长整型的数,就可以省去判断第一位和遍历判断第二位以后是不是数字的情况了。

代码:

    try

    {

        Long l = Long.parseLong(QQ);

        System.out.println("QQ:" + l);

    }

    catch (Exception e)

    {

        System.out.println("出现非法字符");

    }

 

二,但是尽管这样做还是很麻烦,正则表达式则提供了更简便的判断字符串是否符合我们的要求。下面使用正则表达式判断 QQ 号是否符合要求。


Class QQCheck {
    public static void main(String[] args) {
        String qq = "534312354";
        String regex = "[1-9][0-9]{4,14}";
        //regex就是正则表达式的意思,在定义一个规则,第一位是1-9之间的数,从第二位开始是0-9之间的数,一共4到14个,少于4个和多于14都不行
        boolean flag = qq.matches(regex);
        if (flag)
        {
            System.out.println("QQ号是:"qq);
        }
        else
            System.out.println("qq错误,请检查");
    } 
}

三,正则表达式常见操作分类

1,匹配:

匹配就是判断某个字符串是否符合规定的要求,比如上面判断QQ号是不是符合要求,就属于匹配。匹配返回的结果是true或者false

使用的方法:String类的 public boolean matches(String regex)

regex就是正则表达式,判断给定字符串是否符合该表达式。

 

需求:判断用户输入的手机号是不是符合要求。手机号格式13*********15*********18********

分析:手机号第一位是1开头,第二位只能是358,后面全部是数字,手机号是11为数的。

    String  tel = 13854745658;

    String regex = 1[358]\\d{9};  //其中\d代表的是09的数字,也可以写成[0-9],因为windows下的反斜杠会被转义,所以在加一个反斜杠。

    boolean b = tel.matches(regex);

匹配过程:返回的结果是true,过程是:先判断tel的第一个字符是1,判断第二个是不是358,是3,正确,所以判断第三位,是数字,在判断第四个是数字,在判断第五个是数字......如果任意一个不满足,则不再判断下一位,返回错误。

 

2,切割:

使用指定的正则表达式拆分给定的字符串,使用的方法是String类的split()方法

public String[] split(String regex)

注意:字符串拆分后返回的是一个字符串数组。


public class Demo
{
    public static void main(String[] args) {
        String str = "dsfghdfjk*dshgkj*hbj*";
        String[] ss = str.split("\\*");     //需要使用两次转义字符
        for(String s : ss) {
            System.out.println(s);
        }
    }
}

举例:

(1)字符串:s = D:\\abc\\def\\t.txt,切割得到文件夹及目录。

String[] strs = s.split(\\\\);使用两个反斜杠作为转义字符。

 

(2)字符串:s = sgjh    sajgdskjg   sdaghu  e;

需要按照多个空格进行对字符串的拆分,正则表达式为:String regex =  +

一个空格加上一个+号表示,一个或多个空格。

 

3)字符串:s = fgsdkkksdgdfiiigsdfhhsagdfkhghll,按照叠词进行对字符串的切割。

多个空格需要用到组的概念,正则表达式:String regex= (.)\\1+

()就是组,可以让规则的结果被重用,点代表的是任意字符,组的出现都有编号,标号是从1开始的,使用已有的组可以通过 \nn是组号)获取。

该表达式的获取过程是:判断第一个字符是不是字符,是,判断第二个是不是字符,是,判断是不是和第一个相等,是在判断第三个是不是和第二个相等,不是则从这个位置分割一次,在判断第四个......

 

3,替换:

替换是通过String类的replaceAll()方法。

public String replaceAll(String regex,String s)

将字符串的所有匹配regex的字符串替换成s

 

需求:将字符串的超过3位的数字全部替换成#号。


public class Demo2
{
    public static void main(String[] args) {
        String str = "agsdf1535dsh453432653dfshg3546";
//正则表达式:\d代表0到9之间的数字,{3,}代表数字出现三次或三次以上
        String regex = "\\d{3,}"";
        str = str.replaceAll(regex,"#");
        System.out.println(str);
    }
}

举例:

给定的字符串中有叠词,现在要将重叠的字符替换成一个该字符。

String s = asdgdddsdggsagggrrryrtusdfgfd;

String regex = (.)\\1+;

s = s.replaceAll(regex,$1);

$是一个特殊符号,如果想将多个连续相同字符替换成指定该连续字符就要使用$符号。

 

4,获取。

 

四,正则表达式的获取

获取比较特殊,和匹配,切割,替换都不同。获取是将字符串中的复合规则的子串抽取出来。

步骤:

1,将正则表达式封装成对象。

2,让正则表达式和要操作的字符串关联。

3,关联后获取正则表达式的匹配引擎。

4,通过引擎对复合规则的子串进行操作,比如取出。

方法是首先获得Pattern类的对象,因为正则表达式必须首先被编译成此类的实例,然后通过Matcher类的matcher方法创建匹配器,Matcher对象可以与任意的字符串串序列匹配。

Pattern类没有构造函数,所以要通过静态方法获取该类对象。调用顺序是:

 Pattern p = Pattern.compile("a*b");

 Matcher m = p.matcher("aaaaab");

 boolean b = m.matches();

 

其实String类的matchs方法,底层使用的就是Pattern类和Matcher类对象来完成的,只不过是String类对其进行了封装,使用起来比较方便,但是有局限性。

 

需求:需求:获取句子中的三个字母的单词,打印出结果。给定句子:nothing is impossible,never give up our dream.


import java.util.regex.*;
public class Test1
{
    public static void main(String[] args) {
        String str = " nothing is impossible,never give up our dream abc.";
        String reg = "\\b[a-z]{3}\\b";
        //将正则表达式封装成对象
        Pattern p = Pattern.compile(reg);
        //将正则表达式与要操作的字符串关联,获取匹配器
        Matcher m = p.matcher(str);
        
        //将规则作用在字符串
        //boolean b = m.find();//这里find是查找三位字母的单词,直到找到第一个为止
        //System.out.println(m.group());//获取匹配后的结果
        //要想全部找到必须使用循环,可以将find方法看做是一个迭代器。
        while(m.find()) {
            System.out.println(m.group());
        }
    }
}

正则表达式:String reg = "\\b[a-z]{3}\\b";的含义是:az的字母出现三次,\b表示的是单词的边界,两边是边界。

 

五,正则表达式的几个练习

正则表达式在的解题思路是:

(1)如果只想知道该字符串是对或错,使用匹配。matches()

(2)如果要将字符串按照给定的规则进行拆分成多个子串,使用切割。split()

(3)如果要将已有的字符串变成另一个,则使用替换。replaceAll()

(4)要拿到符合要求的子串,使用获取。

 

 

1,练习一:校验邮箱是否正确。

 

分析:邮箱格式必须要有@符号,@左边是字母数字的组合,位数字520位之间,@右边挨着@的部分是字母或数字的组合(可以使纯数字或字母),它后面是.com.cn.edu之类的字符,所以可以将带点的那一部分封装成组,出现一次或多次。


public class Test1
{
    public static void main(String[] args) {
        String mail = "s334g@qq.com.cn";
        mail = "13456@1.n";
        
        //必须有@符号,它左边是数字或字母或数字字母组合,出现5到20次。
        //它右边是字母数字或组合,出现一次或多次,它后面是.com之类的。出现一次或多次
        String reg = "[a-zA-Z_0-9]{5,20}@[a-zA-Z_0-9]+(\\.[a-zA-Z]+)+";
        //不精确的匹配,建议使用上面的正则表达式,比较精确
        //reg = "\\w{5,20}@\\w+(\\.\\w+)+";//不同在于最后的部分,可以使数字或字母
        if(mail.matches(reg)) 
            System.out.println("邮箱是:" + mail);
        else
            System.out.println("邮箱格式错误!");
    }
}

2,练习二:将给定的字符串变成一句正常的话。例如:我我我我我我=====要要要。。。。。进进进..........黑黑黑马马------学学,,,,,,,习习习。。。变成:我要进黑马学习

    代码:


class Test2
{
    public static void main(String[] args) {
        String s = "我我我我我我=====要要要。。。。。进进进..........黑黑黑马马------学学,,,,,,,习习习。。。";
        
        //首先要将中间的符号全部去掉
        s = s.replaceAll("\\=","");
        s = s.replaceAll("\\。","");
        s = s.replaceAll("\\.","");
        s = s.replaceAll("\\-","");
        s = s.replaceAll("\\,","");
        System.out.println(s);
        //去掉重复文字
        s = s.replaceAll("(.)\\1+","$1");//将出现的任意字符当做第一个组1是组的编号
        System.out.println(s);
    }
}

3,练习三:将IP地址按照地址段顺序进行排序,给定的地址段格式是:

192.168.0.2 185.64.51 192.120.75 27.152.52 64.28.125.0 192.168.5.4

 

分析:1,将每一个ip地址的每一段变成三位,因为最高是三位,如果不这样的话,自然排序会按照第一个数字排序,2.152.5.3就会排到192.168.1.0之后。正确方法应该用002.152.005.003192.168.001.000比较才对。

思路:1,将每位ip的每段前面加两个0,

  2,然后去掉每个ip每段后三位的前面一部分,也就是保证每段是三位数。

  3,将字符串按照空格拆分,得到每个ip,添加到TreeSet集合,因为TreeSet集合有排序功能。


import java.util.*;
class Test3
{
    public static void main(String[] args) {
        String ip = "192.168.0.2 185.64.51 192.120.75 27.152.52 64.28.125.0 192.168.5.4";
        String reg = "(\\d+)";//找到连续的数字,该规则要重用,所以封装成组
        //将每段前面加上2个0
        ip = ip.replaceAll(reg,"00$1");//在第一组前面加两个0
        //System.out.println(ip);
        //值保留每段的后三位
        reg = "0*(\\d{3})";//开头是0出现零次或多次,然后是数字出现三次,将数字出现三次封装成组,重用
        ip = ip.replaceAll(reg,"$1");//替换成组1,也就是数字出现三次
        //System.out.println(ip);
        //拆分ip,获得每个ip
        String[] str = ip.split(" +");
        //将每个ip存储到集合中
        TreeSet<String> trees = new TreeSet<>();
        for(String s : str) {
            trees.add(s);
        }
        
        //迭代集合,就是按照大小排序后的结果
        for(String st : trees) {
            st = st.replaceAll("0*(\\d+)","$1");//第一位是0出现零次或多次,然后是数字,出现最少一次,将数字出现一次或多次封装成组
            System.out.println(st);
        }
    }
}

六,综合应用。

需求:编写一个网络爬虫,从一个文本文件中读取所有的邮箱。

 

分析:使用流从一个文本文件中读取每行文本数据,然后获取Pattern对象,每读取一行字符串就获取一次匹配器,寻找该行字符串是不是有符合正则表达式的部分。知道每行字符串都匹配完结束循环。

import java.io.*;
import java.util.*;
import java.util.regex.*;
class Test4
{
	public static void main(String[] args) throws Exception {
		Scanner in = new Scanner(new FileInputStream("mail.txt"));
		//邮箱的正则表达式
		String reg = "[a-zA-Z_0-9]+@[a-zA-Z_0-9]+(\\.[a-zA-Z]+)+";
		Pattern p = Pattern.compile(reg);
		
		//循环匹配每行字符串
		while(in.hasNextLine()) {
			String line = in.nextLine();
			//System.out.println(line);
			Matcher m = p.matcher(line);
			while(m.find()) {
				System.out.println(m.group());
			}
		}
		in.close();
	}
}


如何获取一个网页上的所有邮箱地址呢?只需要将输入流换成网络上的流就可以了。使用URL类获取。


URL url = new URL(“http://127.0.0.1:8080/web/mail.html”);//获取本地主机的Tomcat服务器上的网页。
URLConnection con = url.openConnection();
Scanner in = new Scanner(con.getInputStream());






  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
[正则表达式]文本框输入内容控制 &hellip;.. 默认分类 2009-02-13 10:10 阅读26 评论0 字号: 大大 中中 小小整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$只能输入数字:"^[0-9]*$"。只能输入n位的数字:"^\d{n}$"。只能输入至少n位的数字:"^\d{n,}$"。只能输入m~n位的数字:。"^\d{m,n}$"只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。只能输入有1~3位小数的正实数:"^[0-9]+(.[0-9]{1,3})?$"。只能输入非零的正整数:"^\+?[1-9][0-9]*$"。只能输入非零的负整数:"^\-[1-9][]0-9"*$。只能输入长度为3的字符:"^.{3}$"。只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。只能输入由数字和26个英文字母组成的字符串:"^[A-Za-z0-9]+$"。只能输入由数字、26个英文字母或者下划线组成的字符串:"^\w+$"。验证用户密码:"^[a-zA-Z]\w{5,17}$"正确格式为:以字母开头,长度在6~18之间,只能包含字符、数字和下划线。验证是否含有^%&',;=?$\"等字符:"[^%&',;=?$\x22]+"。只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"验证Email地址:"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$"。验证InternetURL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。验证电话号码:"^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$"正确格式为:"XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX"。验证身份证号(15位或18位数字):"^\d{15}|\d{18}$"。验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"1"~"12"。验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为;"01"~"09"和"1"~"31"。匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内):[^\x00-\xff] 应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)String.prototype.len=function(){return this.replace(/[^\x00-\xff]/g,"aa").length;} 匹配空行的正则表达式:\n[\s| ]*\r 匹配html标签的正则表达式:<(.*)>(.*)<\/(.*)>|<(.*)\/> 匹配首尾空格的正则表达式:(^\s*)|(\s*$) 应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下: String.prototype.trim = function(){return this.replace(/(^\s*)|(\s*$)/g, "");} 利用正则表达式分解和转换IP地址: 下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序: function IP2V(ip){re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址正则表达式if(re.test(ip)){return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1}else{throw new Error("Not a valid IP address!")}} 不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下: var ip="10.100.20.168"ip=ip.split(".")alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1)) 匹配Email地址正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)? 利用正则表达式限制网页表单里的文本框输入内容: 用正则表达式限制只能输入中文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))" 用正则表达式限制只能输入全角字符: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))" 用正则表达式限制只能输入数字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" 用正则表达式限制只能输入数字和英文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" <input onkeyup="value=value.replace(/[^\u4E00-\u9FA5\w]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5\w]/g,''))" value="允许下划线,数字字母和汉字"> <script language="javascript">if (document.layers)//触发键盘事件document.captureEvents(Event.KEYPRESS) function xz(thsv,nob){if(nob=="2"){window.clipboardData.setData("text","")alert("避免非法字符输入,请勿复制字符");return false;}if (event.keyCode!=8 && event.keyCode!=16 && event.keyCode!=37 && event.keyCode!=38 && event.keyCode!=39 && event.keyCode!=40){thsvv=thsv.value;//输入的值thsvs=thsvv.substring(thsvv.length-1);//输入的最后一个字符//thsvss=thsvv.substring(0,thsvv.length-1);//去掉最后一个错误字符if (!thsvs.replace(/[^\u4E00-\u9FA5\w]/g,'') || event.keyCode==189){//正则除去符号和下划线 keythsv.value='请勿输入非法符号 ['+thsvs+']';alert('请勿输入非法符号 ['+thsvs+']');thsv.value="";return false;}}} </script> <input onkeyup="xz(this,1)" onPaste="xz(this,2)" value="">允许数字字母和汉字 <script language="javascript"><!--function MaxLength(field,maxlimit){var j = field.value.replace(/[^\x00-\xff]/g,"**").length;//alert(j);var tempString=field.value;var tt="";if(j > maxlimit){for(var i=0;i<maxlimit;i++){if(tt.replace(/[^\x00-\xff]/g,"**").length < maxlimit)tt = tempString.substr(0,i+1);elsebreak;}if(tt.replace(/[^\x00-\xff]/g,"**").length > maxlimit)tt=tt.substr(0,tt.length-1);field.value = tt;}else{;}}</script> 单行文本框控制<br /><INPUT type="text" id="Text1" name="Text1" onpropertychange="MaxLength(this, 5)"><br />多行文本框控制:<br /><TEXTAREA rows="14"cols="39" id="Textarea1" name="Textarea1" onpropertychange="MaxLength(this, 15)"></TEXTAREA><br /> 控制表单内容只能输入数字,中文....<script>function test() {if(document.a.b.value.length>50){alert("不能超过50个字符!");document.a.b.focus();return false;}}</script><form name=a onsubmit="return test()"><textarea name="b" cols="40" wrap="VIRTUAL" rows="6"></textarea><input type="submit" name="Submit" value="check"></form> 只能是汉字<input onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')"> 只能是英文字符<script language=javascript>function onlyEng(){if(!(event.keyCode>=65&&event.keyCode<=90)) event.returnValue=false;}</script> <input onkeydown="onlyEng();"><input name="coname" type="text" size="50" maxlength="35" class="input2" onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))">只能是数字<script language=javascript>function onlyNum(){if(!((event.keyCode>=48&&event.keyCode<=57)||(event.keyCode>=96&&event.keyCode<=105)))//考虑小键盘上的数字键 event.returnValue=false;}</script> <input onkeydown="onlyNum();"> 只能是英文字符和数字<input onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"> 验证为email格式<SCRIPT LANGUAGE=Javascript RUNAT=Server>function isEmail(strEmail) {if (strEmail.search(/^\w+((-\w+)|(\.\w+))*\@[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$/) != -1)return true;elsealert("oh");}</SCRIPT><input type=text onblur=isEmail(this.value)> 屏蔽关键字(sex , fuck) - 已修改<script language="JavaScript1.2">function test() {if((a.b.value.indexOf ("sex") == 0)||(a.b.value.indexOf ("fuck") == 0)){ alert("五讲四美三热爱"); a.b.focus(); return false;}}</script><form name=a onsubmit="return test()"><input type=text name=b><input type="submit" name="Submit" value="check"></form> 限制文本框里只能输入数字<input onkeyup="if(event.keyCode !=37 && event.keyCode != 39) value=value.replace(/\D/g,'');"onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/\D/g,''))"> <PIXTEL_MMI_EBOOK_2005>2 </PIXTEL_MMI_EBOOK_2005> JAVA正则表达式语法(转)正则表达式语法正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式示例表达式 匹配 /^\s*$/匹配空行。/\d{2}-\d{5}/验证由两位数字、一个连字符再加 5 位数字组成的 ID 号。/<\s*(\S+)(\s[^>]*)?>[\s\S]*<\s*\/\1\s*>/匹配 HTML 标记。下表包含了元字符的完整列表以及它们在正则表达式上下文中的行为:字符 说明 \将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如,“n”匹配字符“n”。“\n”匹配换行符。序列“\\”匹配“\”,“\(”匹配“(”。^匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与“\n”或“\r”之后的位置匹配。$匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与“\n”或“\r”之前的位置匹配。*零次或多次匹配前面的字符或子表达式。例如,zo* 匹配“z”和“zoo”。* 等效于 {0,}。+一次或多次匹配前面的字符或子表达式。例如,“zo+”与“zo”和“zoo”匹配,但与“z”不匹配。+ 等效于 {1,}。?零次或一次匹配前面的字符或子表达式。例如,“do(es)?”匹配“do”或“does”中的“do”。? 等效于 {0,1}。{n}n 是非负整数。正好匹配 n 次。例如,“o{2}”与“Bob”中的“o”不匹配,但与“food”中的两个“o”匹配。{n,}n 是非负整数。至少匹配 n 次。例如,“o{2,}”不匹配“Bob”中的“o”,而匹配“foooood”中的所有 o。“o{1,}”等效于“o+”。“o{0,}”等效于“o*”。{n,m}M 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次。例如,“o{1,3}”匹配“fooooood”中的头三个 o。'o{0,1}' 等效于 'o?'。注意:您不能将空格插入逗号和数字之间。?当此字符紧随任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式是“非贪心的”。“非贪心的”模式匹配搜索到的、尽可能短的字符串,而默认的“贪心的”模式匹配搜索到的、尽可能长的字符串。例如,在字符串“oooo”中,“o+?”只匹配单个“o”,而“o+”匹配所有“o”。.匹配除“\n”之外的任何单个字符。若要匹配包括“\n”在内的任意字符,请使用诸如“[\s\S]”之类的模式。(pattern)匹配 pattern 并捕获该匹配的子表达式。可以使用 $0&hellip;$9 属性从结果“匹配”集合中检索捕获的匹配。若要匹配括号字符 ( ),请使用“\(”或者“\)”。(?:pattern)匹配 pattern 但不捕获该匹配的子表达式,即它是一个非捕获匹配,不存储供以后使用的匹配。这对于用“or”字符 (|) 组合模式部件的情况很有用。例如,'industr(?:y|ies) 是比 'industry|industries' 更经济的表达式。(?=pattern)执行正向预测先行搜索的子表达式,该表达式匹配处于匹配 pattern 的字符串的起始点的字符串。它是一个非捕获匹配,即不能捕获供以后使用的匹配。例如,'Windows (?=95|98|NT|2000)' 匹配“Windows 2000”中的“Windows”,但不匹配“Windows 3.1”中的“Windows”。预测先行不占用字符,即发生匹配后,下一匹配的搜索紧随上一匹配之后,而不是在组成预测先行的字符后。(?!pattern)执行反向预测先行搜索的子表达式,该表达式匹配不处于匹配 pattern 的字符串的起始点的搜索字符串。它是一个非捕获匹配,即不能捕获供以后使用的匹配。例如,'Windows (?!95|98|NT|2000)' 匹配“Windows 3.1”中的 “Windows”,但不匹配“Windows 2000”中的“Windows”。预测先行不占用字符,即发生匹配后,下一匹配的搜索紧随上一匹配之后,而不是在组成预测先行的字符后。x|y匹配 x 或 y。例如,'z|food' 匹配“z”或“food”。'(z|f)ood' 匹配“zood”或“food”。[xyz]字符集。匹配包含的任一字符。例如,“[abc]”匹配“plain”中的“a”。[^xyz]反向字符集。匹配未包含的任何字符。例如,“[^abc]”匹配“plain”中的“p”。[a-z]字符范围。匹配指定范围内的任何字符。例如,“[a-z]”匹配“a”到“z”范围内的任何小写字母。[^a-z]反向范围字符。匹配不在指定的范围内的任何字符。例如,“[^a-z]”匹配任何不在“a”到“z”范围内的任何字符。\b匹配一个字边界,即字与空格间的位置。例如,“er\b”匹配“never”中的“er”,但不匹配“verb”中的“er”。\B非字边界匹配。“er\B”匹配“verb”中的“er”,但不匹配“never”中的“er”。\cx匹配 x 指示的控制字符。例如,\cM 匹配 Control-M 或回车符。x 的值必须在 A-Z 或 a-z 之间。如果不是这样,则假定 c 就是“c”字符本身。\d数字字符匹配。等效于 [0-9]。\D非数字字符匹配。等效于 [^0-9]。\f换页符匹配。等效于 \x0c 和 \cL。\n换行符匹配。等效于 \x0a 和 \cJ。\r匹配一个回车符。等效于 \x0d 和 \cM。\s匹配任何空白字符,包括空格、制表符、换页符等。与 [ \f\n\r\t\v] 等效。\S匹配任何非空白字符。与 [^ \f\n\r\t\v] 等效。\t制表符匹配。与 \x09 和 \cI 等效。\v垂直制表符匹配。与 \x0b 和 \cK 等效。\w匹配任何字类字符,包括下划线。与“[A-Za-z0-9_]”等效。\W与任何非单词字符匹配。与“[^A-Za-z0-9_]”等效。\xn匹配 n,此处的 n 是一个十六进制转义码。十六进制转义码必须正好是两位数长。例如,“\x41”匹配“A”。“\x041”与“\x04”&“1”等效。允许在正则表达式中使用 ASCII 代码。\num匹配 num,此处的 num 是一个正整数。到捕获匹配的反向引用。例如,“(.)\1”匹配两个连续的相同字符。\n标识一个八进制转义码或反向引用。如果 \n 前面至少有 n 个捕获子表达式,那么 n 是反向引用。否则,如果 n 是八进制数 (0-7),那么 n 是八进制转义码。\nm标识一个八进制转义码或反向引用。如果 \nm 前面至少有 nm 个捕获子表达式,那么 nm 是反向引用。如果 \nm 前面至少有 n 个捕获,则 n 是反向引用,后面跟有字符 m。如果两种前面的情况都不存在,则 \nm 匹配八进制值 nm,其中 n 和 m 是八进制数字 (0-7)。\nml当 n 是八进制数 (0-3),m 和 l 是八进制数 (0-7) 时,匹配八进制转义码 nml。\un匹配 n,其中 n 是以四位十六进制数表示的 Unicode 字符。例如,\u00A9 匹配版权符号 (?)。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值