正则表达式理解(一)

1.脱字符(^)和美元符号($)

脱字符^表示开头,美元符号$表示结束。

^表示匹配行开头,每一行都有开头,所以没有实际意义。

$匹配行结尾。

^$匹配行开头,然后是行结尾,多应用在空白行。

^cat$ 匹配行开头,接下来是c*a*t,然后是行结尾,只包含cat的行,没有多余的单词,没有空白符。


2.元字符点号.

.点号是元字符,它能匹配任意字符(包括连字符,句号和斜线)

3.| 或

| 表示或,能够把不同的子表示组合成一个总的表达式,而这个总的表达式又能匹配任意的子表达式。

举个例子^(from|subject|county):

匹配的步骤:

第一步:行起始,然后是f-r-o-m, 然后是:

第二步:行起始,然后是s-u-b-j-e-c-t,然后是:

第三步:行起始,然后是c-o-u-n-t-y,然后是:

简单点说就是匹配以from:,subject:,county:开头的文本行。

4.-i 进行忽略大小写的匹配

5.单词分界符,<和>

元字符序列<和>,可以用来匹配单词分界的位置。可以将它想象成单词版的^和$,非别用来匹配单词开头和结束的位置,举个例子:\<cat\>意思是先是起始位置,然后是c-a-t,然后结束。简单来说就是匹配cat这个单词,而\<cat和cat\>就是匹配以cat开头和结束的单词(注意:<和>本身不是元字符,只有它们和斜线结合起来的时候,整个序列才有特殊意义,这就是我称其为元字符序列的原因。)


还有在字符组内部,元字符的定义规则和意义是不一样的。




阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_34974749/article/details/79974005
文章标签: 正则表达式
个人分类: 正则表达式
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭