metacharacter--元字符,即在正则表达式中有特殊意义的一些字符
A metacharacter is one or more special characters that have a unique meaning, for example, the character ^ (circumflex or caret) is a metacharacter.
escape sequence--就是我们常说的转义字符
An escape sequence is a way of indicating that we want to use one of ourmetacharacters as aliteral.
Brackets, Ranges and Negation
四个最基本的元字符
[ ] 将用[]中的字符匹配,当第一个字符没有找到匹配项时,用第二个字符继续匹配,且每次只匹配一个字符。
例:
[12]表示匹配字符1,如果没有找到,匹配字符2。注意只能匹配 一个字符。
ij17 或ij127或oi222
| 表示匹配两个中的一个
例:
gr(a|e) 可以匹配gray grey 这里和gr[ae]的效果一样
gr((a|e)|i)y will find 'grey', 'grey' and 'griy'.
- 在方括号内使用-可以指定一个range。
例:
[0-9]表示匹配0到9其中的任意数字。jfe845或657
[2-8A-V]表示匹配2到8其中的任意数字,或A-V的字母。jfe845或657或158或ciB17
^在方括号内表示否定,除...之外的意思。
例:
[^a-z]表示除小写字母a到z之外的任何字符。
Positioning metacharacters
即三个关于字符位置的元字符
^ 在方括号之外时表示这是一个字符串的开始。
例:
^win匹配“win win”,"you like windows"则no match。
$ 表示这是一个字符串的结尾。
fox$ 匹配 'fox fox'
. 表示在这个位置可以匹配任意字符。包括空格
“; Windows NT;“
Iteration metacharacters
即可以控制重复次数的元字符?表示可以出现0次或1次。
例:
colou?r 可以匹配colour和coloudr
*表示可以出现0次或多次。
+表示可以出现1次或多次。
{n}表示重复前面的字符或字符范围的次数
例:
[0-9]{3}-[0-9]{4} which would find any number of the form 123-4567。注意这里的-并不是上文说的范围指定,而是写死的一个字符。
a{2} 则匹配 aa
{n,m}表示前面的字符或字符范围至少重复n次,但不能超过m次。
例:
'ba{2,3}b' will find 'baab' and 'baaab' but NOT 'bab' or 'baaaab'.
\表示转义
基本的使用就是这些,这里有两篇更好的文章请参看:
http://dragon.cnblogs.com/archive/2006/05/08/394078.html
http://dragon.cnblogs.com/archive/2006/05/09/394923.html
下面来做一个练习吧~需要用到group的概念。
将下面的语句(1)替换成(2)
(1)
muni.AccretionSched (test
test
test
) from tablename;
(2)
muni.PrefixAccretionSched (test
test
test
) from AccretionSched ;
关键点是:1, muni.后面的字符加上一个Prefix,这个很简单。2,将muni.后面的字符拿来替换 from 之后的tablename。这就是group的概念:相当于将前面匹配上的字符存到一个变量,用于匹配或替换后面的字符串。
3, .可以匹配任意字符,但是是否应该匹配换行符呢?实际上在多数文本编译器中是不能匹配换行符的,在notepad++中可以选择是否匹配。给出的答案是按不会匹配换行符写的。
答案:
muni\.(.+)\(((\r\n.+)+)\) from tablename\;
muni\.Prefix\1\r\n\2from muni\.\1
下面文字和上文无关------------
查找: CREATE TABLE IF NOT EXISTSmuni\.(.+)\(((\r\n.+)+)PRIMARY KEY\(iid\)\);
替换: create or replace viewmuni\.Muni\1\r\nas\r\nselect\2from muni\.\1