vi 中的正则表达式 (Regular Expression)
===================================
.1. 定义和例子
============
正则表达式只是个字符模板,用来在搜索中匹配相同的字符.
在大多数的程式中,正则表达式是括在正斜杠中间的.
例如, /love/就是个以正斜杠为分隔符的正则表达式,其中的
模板love 将用在搜索任何行中和他匹配的字符. 更为有趣的是
正则表达式能够被特别的元字符控制.让我们通过下面的例子来进
一步了解这个概念.
有文本如下:
Hi tom,
I think I failed my anatomy test yesterday. I
had a terrible stomach ache. I ate too many
fried green tomatoes.
Anyway, Tom, Ineed your help. I'd like to make
the test up tomorrow, but don't know where to
begin studying. Do you think you could help me?
After work, about 7 PM, come to my place and I'll
treat you to pizza in return for your help.
Thanks.
Your pal,
guy@phantom

假设您发觉Tom 并没有参加考试,而是David 参加的考试.同时还
发现, 在贺信中Tom的T用的是小写.于是您决定做一个全文替换,把tom
替换为Tom.

在vi命令行模式下输入:
:1, $s/tom/David/g
^ ^ ^ ^ ^
| | | | |---- global 对全文有效
| | | |
| | |--------- 将tom 替换为 David , 使用正则表达式.
| |------- 替换单词
|------ 从文档的第一行到文档的最后一行.

替换后的文本如下:
Hi David,
I think I failed my anaDavidy test yesterday, I
had terible sDavidach ache. I ate too many
fried green Davidatoes.
Anyway, David, I need your help. I'd like to make
the test up Davidorrow, but don't know where to
begin studying. Do you think you could help me?
After work, about ? PM, come to my place and
I'll treat you to pizza in return for your help.
Thanks.
Your pal,
guy@phanDavid

我们发现有些单词中含有tom的的也被替换了.
这是因为我们没有使用正则表达式的元字符来界定一个模板从而控制
字符的替换动作.
使用:
:1, $s/\<[Tt]om\>/David/g
就能够得到我们想要的结果了,即只替换单词tom而不是含有tom字符的
单词.

.2. 正则表达式的元字符
==================
正则表达式的元字符是一些特别的字符,他们允许您以某种方式界定一个
模板来控制什么样的替换将发生.有的元字符锚定一个单词在行首或行尾.
有的元字符允许您指定一个字符范围或一些字符, 来找到大写字母, 小写字母
数字或非数字等.

有两套正则表达式字符集, 一套是基本元字符集, 另一套是扩展元字符集.
另外, POSIX (Portable Operating System Interface for Computer Environment)
标准还提供了一套元字符集.下表提供了能够在任何版本的vi, grep, egrep, sed and gawk
中使用的基本元字符集.
表:
----------------------------------------------------------------------------------------------
元字符 | 功能 | 例子 | 匹配什么
----------------------------------------------------------------------------------------------
^ | 锚定行的开始 | /^love/ | 匹配任何以love开头的行.
----------------------------------------------------------------------------------------------
$ | 锚定行的结束 | /love$/ | 匹配任何以love结束的行.
----------------------------------------------------------------------------------------------
. | 匹配一个字符 | /l..e/ | 匹配这样的行, 这些行包含这样的字符,
| | |第一个字符是 l,紧跟着两个字符,然后是e.
-----------------------------------------------------------------------------------------------
* | 代表0个或多个先前字符 | /*love/ | 匹配这样的行, 有0个或多个空格,空格
| | |候跟着love
-----------------------------------------------------------------------------------------------
[] | 匹配字符组中的一个字符 | /[lL]ove/ | 匹配任何包含love or Love 的行
-----------------------------------------------------------------------------------------------
[x-y] | 匹配以字符范围组成的组中的一个字符 | /[A-Z]ove | 匹配任何这样的行, 这些行包含如下字符
| | |第一个字符是从A到Z 中间的一个, 后面跟
| | |着ove
-----------------------------------------------------------------------------------------------
[^] | 匹配一个不在范围内的字符 | /[^A-Z]ove/ | 匹配任何这样的行, 这些行包含如下字符
| | |第一个字符不是从A到Z 中间的一个, 后面
| | |跟着ove
-----------------------------------------------------------------------------------------------
\ | 用来转义一个字符 | /love\./ | 匹配任何这样的行, 这些行包含如下字符